グーグル、次世代AIモデル「Gemini 1.5」を発表--コンテキストウィンドウが大幅に拡大

Sabrina Ortiz (ZDNET.com) 翻訳校正: 編集部2024年02月16日 11時06分

 Googleは先週、大きなニュースを発表した。具体的には、対話型生成AI「Bard」を「Gemini」に改称したほか、より高度な「Gemini Advanced」を発表し、新しい有料の「Google One AI Premium Plan」として提供開始した。そして、同社は今回、さらなるAI関連の重要なニュースを発表した。

Gemini 1.5 Pro
提供:Google

 Googleは米国時間2月15日、次世代AIモデル「Gemini 1.5」を発表した。「Gemini 1.0」が2023年12月に発表されたばかりだが、Gemini 1.5には、コンテキストウィンドウの拡大、理解力の向上、全体的なパフォーマンスの向上など、複数の大規模なアップグレードが加えられている。

 Googleの最高経営責任者(CEO)であるSundar Pichai氏によると、このモデルは非常に先進的で、同社が初期テスト用にリリースする最初のGemini 1.5モデルである「Gemini 1.5 Pro」は、先週発表された同社の最も先進的な大規模言語モデル(LLM)「Gemini 1.0 Ultra」に匹敵する品質を、より少ない計算量で実現できるという。

 「コンテキストウィンドウの拡大により、実行できることの可能性が広がった」とPichai氏。「全く新しい機能が実現可能になるだけでなく、開発者がより有用なモデルやアプリケーションを構築するのにも役立つ」

 プレスリリースによると、そうした高度なパフォーマンスを達成するために、Gemini 1.5は新しいバージョンのMixture-of-Experts(MoE)アーキテクチャーに基づいて構築されているという。また、そのおかげで、Gemini 1.5がニューラルネットワーク内の最も関連性の高い経路を学習して選択的に有効化することが可能になり、効率が向上するという。

 Googleによると、Gemini 1.5 Proは本番環境で最大100万トークンを処理できるという。Gemini 1.0は3万2000トークンが上限だったので、大幅な増加だ。モデルのコンテキストウィンドウ(入力できる情報量)はトークンで構成されているため、トークン数の増加は注目に値する。モデルに入力できるトークン数が多ければ多いほど、より適切で、より多くの情報に基づいた応答が返ってくる可能性が高くなる。

トークン数の棒グラフ
提供:Google

 GoogleはGemini 1.5 Proについて、「1時間の動画、11時間の音声、3万行以上のコードまたは70万字以上のコードベース」など、膨大な量の情報を一度に処理できるとしている。

 Googleは「AI Studio」と「Vertex AI」を通じて、最大100万トークンのコンテキストウィンドウを有するGemini 1.5 Proを、開発者と法人顧客向けに限定プレビューとして公開した。今後、標準で12万8000トークン、最大100万トークンの価格体系で広く提供する予定だ。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]