2022年11月に登場したChatGPTは、検索エンジン最大手Googleに大きな衝撃を与えました。Googleのビジネスにとって大きな脅威となるChatGPTの登場を受け、Googleは「code red」を宣言。生成AIの開発競争に勝つため、本格的な事業投資を始めました。
この取り組みは、Google Bardだけでなく、Google Geminiのリリースにもつながりました。2023年12月6日(水)に発表されたGoogle Geminiは、同社がChatGPTから生成AIのポジションを奪い取る切り札となるでしょう。
Google Geminiとは?
Geminiは、AlphaGoから学んだトレーニング技術、特に強化学習と探索木(データ構造の一形態)を活用する大規模言語モデル(LLM)セットです。現在、世界で最も優秀な生成AIツールとされているChatGPTを性能面で上回る可能性があります。
Googleは、Brain TeamとDeepMind AIラボを統合して新しい研究チーム「Google DeepMind」を設立。Google Bardおよび次世代PaLM 2 LLMを発表した後、Google Geminiをリリースしました。2032年までに生成AI市場が1兆3000億ドル市場に成長すると予測されるなか、Googleは生成AI分野への投資を積極的に進め、AI開発におけるトップ企業としてポジションを確立しようとしています。
Geminiの仕組みや性能は、何がすごいのか?
2023年5月、GoogleおよびAlphabetのサンダー・ピチャイCEOは、Googke公式ブログ記事でLLMの概要を説明しました。
Geminiはマルチモーダルだ。ツールやAPIの統合の効率性が高く、記憶や計画など将来のイノベーションを可能にするため、一から構築されている。
ピチャイ氏は「まだ初期段階ではあるものの、従来にはない感動的なマルチモーダル機能を開発中」と述べています。
Geminiは細かな調整と厳格な安全テストを経た後、PaLM 2と同様、様々なサイズ・機能で利用可能となる見込みだ。
Google DeepMindのデミス・ハサビスCEOは米大手テックメディアWiredとの独占インタビューで、「Geminiは、AlphaGoシステムの利点と大規模言語モデルの凄まじい能力を、一体化したものになるだろう」と述べています。
GeminiとChatGPTの比較
Geminiリリースをめぐっては、ChatGPTが記録した「月間アクティブユーザー100万人」を超えるかどうかが話題の争点となっています。Googleは当初、Geminiがテキストや画像を生成できる点でGPT-4と差別化しようとしていました。しかし、開発元のOpenAI社は2023年9月25日、ChatGPTの音声・画像クエリ入力機能をアップデートしました。
OpenAIがマルチモーダルなモデルを開発し、ChatGPTによるインターネット検索が可能になった現在、検索エンジン企業としてのGoogleに残された最大のメリットは、独自の広範な学習データとなるかもしれません。なぜなら、Google Geminiは、Google Search、YouTube、Google Books、Google Scholarなどのサービスから総合的にデータを取り入れ、処理できるからです。
こうした独自データを以てGeminiモデルを学習させることで、データセットから得られる識別や推論の精度に優位性が生まれるかもしれません。GeminiがGPT-4よりも2倍多いトークンで訓練されているという報告もあります。
加えて、2024年はGoogle DeepMindとGoogle Brain Teamの企業間コラボも注目です。Googleは、同社のセルゲイ・ブリン共同創立者やDeepMindのポール・バーハムAI科学者兼機械学習専門家を含めた世界トップの人工知能(AI)研究チームを構成し、OpenAI社と市場シェア競争を繰り広げることになります。
GoogleのAI研究チームは、強化学習や探索木などの技術を適用し、フィードバックを収集して経時的な問題解決能力向上を目指AIプログラムの開発手法を深く理解しています。DeepMindチームの協力を得て同様の技術を取り入れたAlphaGoは、2016年、囲碁の世界チャンピオンに勝利しています。
Geminiを取り巻くAI開発競争
マルチモーダル能力、強化学習の使用、テキストと画像の生成能力、そしてGoogleの独自データを組み合わせたGeminiは、GPT-4を上回るために必要な条件を兼ね備えていると考えられます。
LLM市場シェア競争の勝敗を占う鍵となるのは「学習データ」となるでしょう。なぜなら、最も巨大かつ豊富なデータセットでモデルを学習させることができた企業が、この競争に勝つ可能性が高いと見られているからです。
OpenAIはすでに次世代マルチモーダルLLM「Gobi」の開発に取り組んでいると報じられているため、生成AI市場のトップが変わらない可能性もあります。注目すべき点は、どの企業がマルチモーダルAIをより良く改善できるかになるでしょう。