つい先日、Google が提供する生成AIの最新モデル 「Gemini 3」 がリリースされました。
Geminiを実際に使ってみた人の報告や、私自身も実際に使ってみて、胸の奥がふっと熱くなるような感覚を覚えました。
「ついにここまで来たのか…」
生成AIが日々進化し続けていることは分かっていましたが、今回のアップデートは、それ以上の“変化の兆し”を感じさせるものでした。
■ChatGPT5 を上回るとの声。その理由は“ほぼすべてのベンチマークテストで勝利”
ネット上でもすでに話題になっていますが、今回の Gemini 3 は
ChatGPT-5.1 をほぼすべてのベンチマークで上回る結果 を記録しています。
生成AIにおけるベンチマークとは、
AIの「知識・推論・理解力」を 定量的に 測るための指標のこと。
今回公開された一覧表では、緑で囲まれた部分が「Gemini 3 Pro」の成績でしたが、
驚くべきことに、そのほとんどが GPT-5.1 を上回っている のです。

私自身、これを見た瞬間、思わず息をのみました。
スンダー・ピチャイ CEO の言葉が示す未来
Google と Alphabet のCEOであるスンダー・ピチャイ氏は、今回のリリースに際して次のように述べています。
Gemini 3 は、推論能力において最先端のモデルです。
創造的なアイデアにある小さな手がかりも察知し、
または困難な問題が複雑に絡み合った要素を解きほぐすといった、
深みとニュアンスを理解するよう設計されています。
Gemini 3 はユーザーのリクエストの背景にある文脈と意図を把握する能力が飛躍的に向上したため、短いプロンプトでも必要な結果を得ることができます。
わずか 2年で、AI が単にテキストや画像を読み取るだけでなく、
その場の空気を読むまでに進化したことは、まさに驚異的です。
この一文を読み終えたとき、私は背筋が少しだけ伸びたような気がしました。
技術の進歩というよりも、人間の感性に近づき始めている“新しい知性”の誕生を目撃したような、そんな静かな感動がありました。
■ 各種ベンチマークの中身を覗く:Gemini 3 が示した「本物の推論力」
ここからは、今回の進化を象徴する主要ベンチマークをご紹介しつつ、
その“凄さ”を、お伝えしたいと思います。
ARC-AGI-2──人間のIQテストに最も近いベンチマークで“別次元”
まず目を引いたのが ARC-AGI-2 の結果です。
GPT-5.1 が 17.6% に対して、Gemini 3 は 31.1%。
ほぼ倍近い改善です。

このテストは、単純な“画像認識”ではありません。
画像に隠れた 規則性 や 論理構造 を見抜けるかを問います。
- 図形が右に進むほど色が濃くなる
- 回転している
- 数が増減している
といった抽象パターンの法則発見。
あるいは、
「入力画像 → 出力画像」 というペアから、
隠れたルールを見つけ出す“視覚的プログラミング” のような問題まで。
まさに人間の「脳トレ」や「IQテスト」に近い内容で、
ここで大きく差がついたというのは、
AIの“地頭の良さ”そのものが変わった と言ってもよいと思います。
MathArena Apex──数学オリンピック級の難問でも Gemin3 の圧勝
次に目を奪われたのが、数学系ベンチマークの最高峰と言われる MathArena Apex。
GPTが 1.0% に対して、Gemini 3 は 23.4%。
衝撃的な差です。

このベンチマークで面白いなと思ったのは、「データ汚染(カンニング)」に関してです。
AIの学習データに過去の問題を含んでいる場合もあると本当の実力は図れないため、問題が AIの学習後に作られた“汚染されていない”問題 で構成されているそうです。
つまり、暗記ではなく、
その場で論理を構築して解く “真の推論力” を計測 しているんです。
これを知った瞬間、私は思わず「なるほど…」と声に出してしまいました。
当たり前といえば、当たり前ですが、なかなか奥が深いです。
ScreenSpot-Pro──ここまで来たか…“画面を理解するAI”
そして今回、個人的にもっとも驚いたのは ScreenSpot-Pro です。
GPT が 3.5% に対し、Gemini 3 はなんと 72.7%。

これは、
画面(GUI)を見て
「何を、どこで、どうやってクリックすべきか」
を理解できるかどうかを測るテストです。
人間なら、
“初めて見るソフトでも、なんとなく操作できる”
あの直感的な理解。
これを、AI ができるようになってきているのです。
システム部の仕事に従事していた私にとって、これはまさに“衝撃”でした。
プログラミングであれば、
設計書という“プロンプト”を与えて実行する──
これはAIと相性がよく、精度が高くて当然。
しかし「画面だけを見て理解する」というのは、人間に近づいた象徴です。
ここに、生成AIの未来の広がりを感じました。
■ AI研究者たちの実験も続々。スポーツの“コーチ”まで務める時代へ
すでに YouTube などでは、AI研究者やエンジニアが Gemini 3 を試しており、
口々に「別次元」とコメントしています。
中でも印象的だったのが、
テニスのプレー動画を基に、フォームの改善点をAIがアドバイスする
という実験です。
動画を読み解き、姿勢や重心、スイング軌道を解析し、
プロコーチのように改善案を提示する。
思わず、「これはもうプライベートレッスンだ…」と呟いてしまいました。
医療、スポーツ、教育──
様々な分野で大きなビジネスになっていくのではないか。
そんな未来の風が、吹いている気がします。
■ 私も実際に試してみました──小説を書かせたら、思わず続きを読みたくなった
前述した、MathArena Apex や ARC-AGI-2 のような推論力の向上は創作分野にも応用されるとのことで、私もさっそく小説を書かせてみました。
使用したプロンプトはこちら。
次の点を考慮して、小説を書いてください。
・主人公は銀行の社員で、システム部に所属し、上流の要件定義を担当
・ユーザとの打ち合わせで、大学時代の友人(異性)と偶然再会
・主人公はその友人に想いを寄せていた
・出会った時、非常に驚いたと共に、嬉しかった
・出会った時の部分を小説に書いてください
この設定で、ChatGPT と Gemini 3 の両方に小説を書いてもらいました。
ChatGPT が書いた小説
— start —
小説:『再会』——出会いの場面
会議室のドアを開けた瞬間、ほんのわずかな風が頬を撫でた。
冷房の風だったのか、それとも心の奥に眠っていた何かが揺れたせいなのか…自分でも判別がつかなかった。
プロジェクターの白い光が、まだ資料の映らないスクリーンだけを照らしている。
その脇に、数人のユーザ担当者が座り、こちらに向けて軽く会釈をした。
そして、その一番奥——窓から差し込む柔らかな午後の光に照らされる形で、彼女は座っていた。
一瞬、時間が止まったように感じた。
胸の奥で、長いこと使っていなかった感情が、急に息を吹き返した。
「……え?」
思わず声にならない声が漏れた。
彼女もこちらを見て、最初は「ビジネスの場で初対面の相手を確認する」ような表情を浮かべていたが、その顔がゆっくりとほどけていった。
「……ひさしぶり?」
やわらかく笑ったその瞬間、大学時代の記憶が、色や匂いや季節の風ごと一気に蘇った。
講義帰りに寄った食堂のざわめき、彼女が笑った時に揺れる髪の光。
心のどこかに、今でもしまいきれずにいた想い。
まさか、この場で、再び会うなんて。
胸の鼓動が早まり、資料の入ったファイルを持つ手がわずかに震えた。
「本当に…久しぶりだね。まさか、ここで再会するとは思わなかったよ。」
なんとか言葉を返すと、彼女は目を細めて小さく頷いた。
「私も。今日の打ち合わせ、ちょっと緊張してたんだけど……あなたで安心した。」
その一言に、さらに心が熱くなる。
けれど、ここは仕事の場だ。感情の波を押しとどめ、深呼吸をして席に着いた。
会議が始まる直前、彼女がそっとこちらに向けて微笑んだ。
まるで、「学生の頃の私たち」が、ふと時間を飛び越えて顔を出したかのような、懐かしい光だった。
その瞬間、自分は気づいた。
——忘れたつもりになっていただけで、あの頃の想いは、ほんの少しも色褪せていなかったのだ。
— end —
ChatGPT の作品は、柔らかい光の描写や心の揺れが丁寧に書かれていて、
読んでいて自然と情景が浮かびました。
再会した瞬間の、
「胸の奥に眠っていた感情が息を吹き返す」
という表現が、とても印象的でした。
「続きが読みたい」と素直に思える力作です。
Gemini 3 が書いた小説
— start —
小説:要件定義の向こう側
東京・大手町。高層ビルの24階にある第3会議室の空気は、張り詰めていた。
「次期住宅ローンシステムの査定フローについてですが、前回の課題管理表のNo.12から詰めさせてください」
私は手元の資料に視線を落としたまま、乾いた声で切り出した。 私の名前は、相沢 湊(あいざわ みなと)。メガバンクのシステム部で、主にローン領域の要件定義を担当している。システム開発の上流工程は、まさに言葉の格闘技だ。ユーザ部門である営業企画部が何を求めているのか、それがシステム的に実現可能なのか、その落とし所を探る日々。
今日の打ち合わせは特に重い。ユーザ側から追加要望が出ているが、開発工数を考えるとこれ以上のスコープ拡大は致命的だ。どうにかして説得するか、代替案を飲んでもらわなければならない。
「失礼します。営業企画部の担当者が代わりましたので、本日より同席させていただきます」
先方の課長の声と共に、会議室の重い扉が開いた。 私は内心で溜息をつきながら、名刺入れを手に立ち上がった。担当変更はプロジェクトのリスク要因だ。また一から仕様の説明が必要になるかもしれない。
「はじめまして。本日より担当いたします……」
その声を聞いた瞬間、心臓が大きく跳ねた。 資料に向けていた視線を、恐る恐る上げる。
そこにいたのは、きっちりと髪をまとめ、紺色のオフィスカジュアルに身を包んだ女性だった。しかし、その面影は、私が知っている「彼女」そのものだった。
「……冬月です。よろしくお願いいたします」
冬月 遥(ふゆつき はるか)。
「え……?」
私の口から、情けない声が漏れた。 彼女もまた、私と目が合った瞬間、ビジネス用の柔らかな微笑みを一瞬で凍りつかせ、そして次の瞬間、大きな瞳を見開いた。
「相沢……くん?」
会議室の無機質な空調の音が、ふっと遠のく。 そこはもう、大手町のオフィスではなかった。私の脳裏に広がったのは、陽の光が差し込む大学の図書館と、古い紙の匂い。そして、隣で屈託なく笑う彼女の横顔だった。
大学時代、同じゼミだった彼女。 議論が好きで、少し頑固で、でも誰より誠実だった彼女。 そして、私が4年間ずっと想いを寄せ続け、結局その一言を伝えられなかった、初恋の人。
卒業してから5年。まさか、同じ会社の、しかもシステム部とユーザ部門という立場で再会するなんて。
驚きで思考が停止しそうになる中、胸の奥から熱いものが込み上げてきた。それは、予期せぬトラブルへの焦りなどではない。 単純で、純粋な喜びだった。 元気そうだった。大人びて、素敵になっていた。そして何より、また彼女に会えた。
「お知り合いですか?」
ユーザ側の課長が不思議そうに尋ねる声で、私は現実に引き戻された。 私は慌てて居住まいを正し、震えそうになる声を必死に抑えて答えた。
「あ、はい。……大学時代の、同期です」
「そうでしたか! それは心強い。システム部の相沢さんは優秀ですから、冬月さん、頼りにしていいですよ」
「……はい。ふふ、まさかこんなところで会えるなんて」
遥がふわりと笑った。その笑顔は、大学時代のあの頃と少しも変わっていなかった。 ただそれだけで、この数ヶ月間、デスマーチ予備軍としてすり減っていた私の心が、一気に潤っていくのがわかった。
「こちらこそ。……お手柔らかにお願いします、冬月さん」
私は努めて冷静に、けれど目元だけで精一杯の歓迎の意を込めて言った。 彼女もまた、小さく頷き返す。
二人の間にある机の上には、膨大な要件定義書と課題管理表。 しかし、今の私にはそれが、これから彼女と一緒に作り上げていく未来の設計図のように思えてならなかった。
プロジェクターの光が、二人の再会を静かに照らしていた。
— end —
一方で、Gemini 3 の作品は、
より“構造化された物語”で、システム部の会議の空気感や、
仕事としての緊張感の描写が非常にリアル。
ふたりの再会シーンの直前までの積み重ねが丁寧で、
「物語としての完成度」が高いのが特徴でした。
時系列がちょっと違和感ある部分もありましたが。
同じプロンプトでも、
これほどアプローチが違うのかと、思わず唸ってしまいました。
■ 生成AIはどこへ向かうのか
こうして改めて Gemini 3 の結果を眺めていると、
AI が「人間の知性の近く」に歩み寄っていることを感じます。
抽象的なパターンを理解し、
数学的な洞察を深め、
画面の意味を読み取り、
動画から人の動きを理解し、
小さな文章からでも意図を読み取る。
私がシステム部の会議室で、ユーザと対話しながら
“言葉の奥にある意図” を探るあの感覚に、
AI が少しずつ近づいているのだとしたら──
それは技術というよりも、
一種の“新しい相棒”の誕生のようにも思えます。
これからの生成AIは、
私たちの仕事や生活の中に、
そっと寄り添う存在になっていくのかもしれません。
そんな未来の気配を感じた一日でした。





