Gemini 3がついに登場｜ChatGPTを超えた理由と圧倒的ベンチマーク結果を解説【AI時代の転換点】

つい先日、Google が提供する生成AIの最新モデル 「Gemini 3」 がリリースされました。
Geminiを実際に使ってみた人の報告や、私自身も実際に使ってみて、胸の奥がふっと熱くなるような感覚を覚えました。

「ついにここまで来たのか…」

生成AIが日々進化し続けていることは分かっていましたが、今回のアップデートは、それ以上の“変化の兆し”を感じさせるものでした。

■ChatGPT5 を上回るとの声。その理由は“ほぼすべてのベンチマークテストで勝利”

ネット上でもすでに話題になっていますが、今回の Gemini 3 は
ChatGPT-5.1 をほぼすべてのベンチマークで上回る結果 を記録しています。

生成AIにおけるベンチマークとは、
AIの「知識・推論・理解力」を 定量的に 測るための指標のこと。

今回公開された一覧表では、緑で囲まれた部分が「Gemini 3 Pro」の成績でしたが、
驚くべきことに、そのほとんどが GPT-5.1 を上回っている のです。

私自身、これを見た瞬間、思わず息をのみました。

スンダー・ピチャイ CEO の言葉が示す未来

Google と Alphabet のCEOであるスンダー・ピチャイ氏は、今回のリリースに際して次のように述べています。

Gemini 3 は、推論能力において最先端のモデルです。
創造的なアイデアにある小さな手がかりも察知し、
または困難な問題が複雑に絡み合った要素を解きほぐすといった、
深みとニュアンスを理解するよう設計されています。
Gemini 3 はユーザーのリクエストの背景にある文脈と意図を把握する能力が飛躍的に向上したため、短いプロンプトでも必要な結果を得ることができます。
わずか 2年で、AI が単にテキストや画像を読み取るだけでなく、
その場の空気を読むまでに進化したことは、まさに驚異的です。

この一文を読み終えたとき、私は背筋が少しだけ伸びたような気がしました。
技術の進歩というよりも、人間の感性に近づき始めている“新しい知性”の誕生を目撃したような、そんな静かな感動がありました。

■ 各種ベンチマークの中身を覗く：Gemini 3 が示した「本物の推論力」

ここからは、今回の進化を象徴する主要ベンチマークをご紹介しつつ、
その“凄さ”を、お伝えしたいと思います。

ARC-AGI-2──人間のIQテストに最も近いベンチマークで“別次元”

まず目を引いたのが ARC-AGI-2 の結果です。

GPT-5.1 が 17.6% に対して、Gemini 3 は 31.1%。
ほぼ倍近い改善です。

このテストは、単純な“画像認識”ではありません。
画像に隠れた 規則性 や 論理構造 を見抜けるかを問います。

図形が右に進むほど色が濃くなる
回転している
数が増減している

といった抽象パターンの法則発見。

あるいは、
「入力画像 → 出力画像」というペアから、
隠れたルールを見つけ出す“視覚的プログラミング” のような問題まで。

まさに人間の「脳トレ」や「IQテスト」に近い内容で、
ここで大きく差がついたというのは、
AIの“地頭の良さ”そのものが変わった と言ってもよいと思います。

MathArena Apex──数学オリンピック級の難問でも Gemin3 の圧勝

次に目を奪われたのが、数学系ベンチマークの最高峰と言われる MathArena Apex。

GPTが 1.0% に対して、Gemini 3 は 23.4%。
衝撃的な差です。

このベンチマークで面白いなと思ったのは、「データ汚染（カンニング）」に関してです。
AIの学習データに過去の問題を含んでいる場合もあると本当の実力は図れないため、問題が AIの学習後に作られた“汚染されていない”問題 で構成されているそうです。

つまり、暗記ではなく、
その場で論理を構築して解く “真の推論力” を計測 しているんです。

これを知った瞬間、私は思わず「なるほど…」と声に出してしまいました。
当たり前といえば、当たり前ですが、なかなか奥が深いです。

ScreenSpot-Pro──ここまで来たか…“画面を理解するAI”

そして今回、個人的にもっとも驚いたのは ScreenSpot-Pro です。

GPT が 3.5% に対し、Gemini 3 はなんと 72.7%。

これは、
画面（GUI）を見て
「何を、どこで、どうやってクリックすべきか」
を理解できるかどうかを測るテストです。

人間なら、
“初めて見るソフトでも、なんとなく操作できる”
あの直感的な理解。

これを、AI ができるようになってきているのです。

システム部の仕事に従事していた私にとって、これはまさに“衝撃”でした。

プログラミングであれば、
設計書という“プロンプト”を与えて実行する──
これはAIと相性がよく、精度が高くて当然。

しかし「画面だけを見て理解する」というのは、人間に近づいた象徴です。
ここに、生成AIの未来の広がりを感じました。

■ AI研究者たちの実験も続々。スポーツの“コーチ”まで務める時代へ

すでに YouTube などでは、AI研究者やエンジニアが Gemini 3 を試しており、
口々に「別次元」とコメントしています。

中でも印象的だったのが、

テニスのプレー動画を基に、フォームの改善点をAIがアドバイスする

という実験です。

動画を読み解き、姿勢や重心、スイング軌道を解析し、
プロコーチのように改善案を提示する。

思わず、「これはもうプライベートレッスンだ…」と呟いてしまいました。

医療、スポーツ、教育──
様々な分野で大きなビジネスになっていくのではないか。
そんな未来の風が、吹いている気がします。

■ 私も実際に試してみました──小説を書かせたら、思わず続きを読みたくなった

前述した、MathArena Apex や ARC-AGI-2 のような推論力の向上は創作分野にも応用されるとのことで、私もさっそく小説を書かせてみました。

使用したプロンプトはこちら。

次の点を考慮して、小説を書いてください。
・主人公は銀行の社員で、システム部に所属し、上流の要件定義を担当
・ユーザとの打ち合わせで、大学時代の友人（異性）と偶然再会
・主人公はその友人に想いを寄せていた
・出会った時、非常に驚いたと共に、嬉しかった
・出会った時の部分を小説に書いてください

この設定で、ChatGPT と Gemini 3 の両方に小説を書いてもらいました。

ChatGPT が書いた小説

—　start　—

小説：『再会』——出会いの場面

会議室のドアを開けた瞬間、ほんのわずかな風が頬を撫でた。
冷房の風だったのか、それとも心の奥に眠っていた何かが揺れたせいなのか…自分でも判別がつかなかった。

プロジェクターの白い光が、まだ資料の映らないスクリーンだけを照らしている。
その脇に、数人のユーザ担当者が座り、こちらに向けて軽く会釈をした。

そして、その一番奥——窓から差し込む柔らかな午後の光に照らされる形で、彼女は座っていた。

一瞬、時間が止まったように感じた。
胸の奥で、長いこと使っていなかった感情が、急に息を吹き返した。

「……え？」

思わず声にならない声が漏れた。
彼女もこちらを見て、最初は「ビジネスの場で初対面の相手を確認する」ような表情を浮かべていたが、その顔がゆっくりとほどけていった。

「……ひさしぶり？」

やわらかく笑ったその瞬間、大学時代の記憶が、色や匂いや季節の風ごと一気に蘇った。
講義帰りに寄った食堂のざわめき、彼女が笑った時に揺れる髪の光。
心のどこかに、今でもしまいきれずにいた想い。

まさか、この場で、再び会うなんて。

胸の鼓動が早まり、資料の入ったファイルを持つ手がわずかに震えた。

「本当に…久しぶりだね。まさか、ここで再会するとは思わなかったよ。」

なんとか言葉を返すと、彼女は目を細めて小さく頷いた。

「私も。今日の打ち合わせ、ちょっと緊張してたんだけど……あなたで安心した。」

その一言に、さらに心が熱くなる。
けれど、ここは仕事の場だ。感情の波を押しとどめ、深呼吸をして席に着いた。

会議が始まる直前、彼女がそっとこちらに向けて微笑んだ。
まるで、「学生の頃の私たち」が、ふと時間を飛び越えて顔を出したかのような、懐かしい光だった。

その瞬間、自分は気づいた。

——忘れたつもりになっていただけで、あの頃の想いは、ほんの少しも色褪せていなかったのだ。

—　end　—

ChatGPT の作品は、柔らかい光の描写や心の揺れが丁寧に書かれていて、
読んでいて自然と情景が浮かびました。

再会した瞬間の、
「胸の奥に眠っていた感情が息を吹き返す」
という表現が、とても印象的でした。

「続きが読みたい」と素直に思える力作です。

Gemini 3 が書いた小説

—　start　—

小説：要件定義の向こう側

東京・大手町。高層ビルの24階にある第3会議室の空気は、張り詰めていた。

「次期住宅ローンシステムの査定フローについてですが、前回の課題管理表のNo.12から詰めさせてください」

私は手元の資料に視線を落としたまま、乾いた声で切り出した。私の名前は、相沢湊（あいざわみなと）。メガバンクのシステム部で、主にローン領域の要件定義を担当している。システム開発の上流工程は、まさに言葉の格闘技だ。ユーザ部門である営業企画部が何を求めているのか、それがシステム的に実現可能なのか、その落とし所を探る日々。

今日の打ち合わせは特に重い。ユーザ側から追加要望が出ているが、開発工数を考えるとこれ以上のスコープ拡大は致命的だ。どうにかして説得するか、代替案を飲んでもらわなければならない。

「失礼します。営業企画部の担当者が代わりましたので、本日より同席させていただきます」

先方の課長の声と共に、会議室の重い扉が開いた。私は内心で溜息をつきながら、名刺入れを手に立ち上がった。担当変更はプロジェクトのリスク要因だ。また一から仕様の説明が必要になるかもしれない。

「はじめまして。本日より担当いたします……」

その声を聞いた瞬間、心臓が大きく跳ねた。資料に向けていた視線を、恐る恐る上げる。

そこにいたのは、きっちりと髪をまとめ、紺色のオフィスカジュアルに身を包んだ女性だった。しかし、その面影は、私が知っている「彼女」そのものだった。

「……冬月です。よろしくお願いいたします」

冬月遥（ふゆつきはるか）。

「え……？」

私の口から、情けない声が漏れた。彼女もまた、私と目が合った瞬間、ビジネス用の柔らかな微笑みを一瞬で凍りつかせ、そして次の瞬間、大きな瞳を見開いた。

「相沢……くん？」

会議室の無機質な空調の音が、ふっと遠のく。そこはもう、大手町のオフィスではなかった。私の脳裏に広がったのは、陽の光が差し込む大学の図書館と、古い紙の匂い。そして、隣で屈託なく笑う彼女の横顔だった。