“思考する”AI「Gemini 2.5 Pro」は「Gemini 2.0」から何が進化した?加速するGoogleのAI開発【前編】

2025年3月、Googleは新LLM「Gemini 2.5 Pro」の試験運用版を発表した。同モデルはどのような価値をユーザーにもたらすのか。「Gemini 2.0」からの強化点とは。

2025年06月16日 07時00分 公開
[Sean Michael KernerTechTarget]

関連キーワード

人工知能 | Google | 開発ツール


 各AI(人工知能)ベンダーは次々と新しい大規模言語モデル(LLM)を発表しており、その勢いはとどまる気配がない。中でもGoogleの「Gemini」シリーズは注目されるLLMの一つだ。

 Googleは2023年12月に「Gemini 1.0」、2024年2月に「Gemini 1.5 Pro」を発表。同年12月には「Gemini 2.0」を発表し、2025年3月には早くも「Gemini 2.5 Pro」の試験運用版を公開しており、Geminiの革新スピードは加速している。Gemini 2.5 Proはどのような進化を遂げているのか。

「Gemini 2.5 Pro」は「Gemini 2.0」から何が進化した?

 Gemini 2.5 Proは、AI研究開発機関Google DeepMindが開発したLLMであり、2025年3月の登場時点でGoogle史上最も高性能なAIモデルと位置付けられている。Gemini 2.5 Proの発表は、以下のような推論モデルがLLM市場で存在感を強める中での動きと捉えることができる。

  • DeepSeekの「DeepSeek-R1」
  • OpenAIの「OpenAI o3」
  • Anthropicの「Claude 3.7 Sonnet」

 特に注目すべきは、Gemini 2.5 Proが「思考モデル」(Thinking Model)として設計されている点だ。高度な推論機能が中核に据えられており、2024年12月に発表された試験運用版の推論モデル「Gemini 2.0 Flash Thinking」の進化版と位置付けられる。

 Gemini 2.5 Proは、プロンプト(AIモデルに対する指示)の遂行に必要な手順を段階的に推論するChain-of-Thought(CoT:思考の連鎖)手法を内部で自律的に処理する設計を採用しており、文脈に即したより精度の高い出力が可能となっている。

 GoogleはGemini 2.5 Proに対し、強化学習や事後学習などの技術を適用することで、さらなる精度向上を図っている。公開時点のコンテキストウィンドウ(生成AIがやりとりの中で保持できる情報量)は最大100万トークン(テキストデータを処理する際の基本的な単位)で、将来的には200万トークンに拡張する計画だ。

 Gemini 2.5 Proのその他の主な強化点は以下の通り。

  • 推論能力の強化
    • Gemini 2.5 Proの最大の特長は、推論性能が強化されたことだ。Googleによれば、同モデルはLLMの知識と推論能力を測るベンチマークテスト「Humanity's Last Exam」において、OpenAI o3の他、Anthropicの「Claude 3.7 Sonnet」、DeepSeekの「DeepSeek R1」などの競合モデルを上回るスコアを記録している。
  • コーディング能力の向上
    • Gemini 2.5 Proは、ソースコードの生成および実行機能が強化されており、クラウドサービス「Google Cloud」を中心とする開発環境の利便性向上に大きく貢献している。
    • 従来モデルに比べてソースコードの生成、デバッグ、関数呼び出し、ワークフロー自動化などの精度が強化されている。ソースコードの自動生成だけでなく、実行結果の検証や改善提案までできるなど、開発支援における実用性が高まっており、ユーザーインタフェース(UI)デザインを含む視覚的に魅力的なアプリケーションの構築にも役立つ。
    • ソフトウェア開発タスクのベンチマークテスト「SWE-Bench Verified」では63.8%のスコアを記録。OpenAIの「GPT-4.5」のスコア(49.3%)を上回った一方で、Claude 3.7 Sonnetのスコア(70.3%)にはわずかに及ばない結果となった。
  • 数学・科学分野の能力強化
    • 2025年に開催された数学コンテスト「American Invitational Mathematics Examination」(AIME)では、86.7%の正答率を達成した。
    • 博士号レベルの科学問題を扱うベンチマークテスト「GPQA」の中でも最も最難関とされる「ダイヤモンド」レベルでは、84%の正答率を達成した。
  • マルチモーダル機能の強化
    • Gemini 2.0と同様マルチモーダルモデルであり、テキスト、音声、画像、動画、ソースコードといった複数のデータ形式を理解できる。ただし、2025年3月時点では画像、動画の生成機能は実装されていない。
  • リアルタイム処理
    • 多くの機能強化にもかかわらず、処理遅延は抑制されており、リアルタイム性が求められるアプリケーションや、インタラクティブな対話用途にも十分対応可能だ。

 次回は、Gemini 2.5 Proの用途や他サービスとの連携について解説する。

TechTarget発 先取りITトレンド

米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...