※記事内に商品プロモーションを含む場合があります
ライフログ

Gemini 3 リリース──生成AIはついに “空気を読む” 時代へ。ChatGPT超えを、体験してみました

アイキャッチ

つい先日、Google が提供する生成AIの最新モデル 「Gemini 3」 がリリースされました。
Geminiを実際に使ってみた人の報告や、私自身も実際に使ってみて、胸の奥がふっと熱くなるような感覚を覚えました。

「ついにここまで来たのか…」

生成AIが日々進化し続けていることは分かっていましたが、今回のアップデートは、それ以上の“変化の兆し”を感じさせるものでした。

■ChatGPT5 を上回るとの声。その理由は“ほぼすべてのベンチマークテストで勝利”

ネット上でもすでに話題になっていますが、今回の Gemini 3 は
ChatGPT-5.1 をほぼすべてのベンチマークで上回る結果 を記録しています。

生成AIにおけるベンチマークとは、
AIの「知識・推論・理解力」を 定量的に 測るための指標のこと。

今回公開された一覧表では、緑で囲まれた部分が「Gemini 3 Pro」の成績でしたが、
驚くべきことに、そのほとんどが GPT-5.1 を上回っている のです。

Geminiベンチマーク3

私自身、これを見た瞬間、思わず息をのみました。

スンダー・ピチャイ CEO の言葉が示す未来

Google と Alphabet のCEOであるスンダー・ピチャイ氏は、今回のリリースに際して次のように述べています。

Gemini 3 は、推論能力において最先端のモデルです。
創造的なアイデアにある小さな手がかりも察知し、
または困難な問題が複雑に絡み合った要素を解きほぐすといった、
深みとニュアンスを理解するよう設計されています。
Gemini 3 はユーザーのリクエストの背景にある文脈と意図を把握する能力が飛躍的に向上したため、短いプロンプトでも必要な結果を得ることができます。
わずか 2年で、AI が単にテキストや画像を読み取るだけでなく、
その場の空気を読むまでに進化したことは、まさに驚異的です。

この一文を読み終えたとき、私は背筋が少しだけ伸びたような気がしました。
技術の進歩というよりも、人間の感性に近づき始めている“新しい知性”の誕生を目撃したような、そんな静かな感動がありました。


■ 各種ベンチマークの中身を覗く:Gemini 3 が示した「本物の推論力」

ここからは、今回の進化を象徴する主要ベンチマークをご紹介しつつ、
その“凄さ”を、お伝えしたいと思います。


ARC-AGI-2──人間のIQテストに最も近いベンチマークで“別次元”

まず目を引いたのが ARC-AGI-2 の結果です。

GPT-5.1 が 17.6% に対して、Gemini 3 は 31.1%
ほぼ倍近い改善です。

GeminiベンチマークARC AGI

このテストは、単純な“画像認識”ではありません。
画像に隠れた 規則性論理構造 を見抜けるかを問います。

  • 図形が右に進むほど色が濃くなる
  • 回転している
  • 数が増減している

といった抽象パターンの法則発見。

あるいは、
「入力画像 → 出力画像」 というペアから、
隠れたルールを見つけ出す“視覚的プログラミング” のような問題まで。

まさに人間の「脳トレ」や「IQテスト」に近い内容で、
ここで大きく差がついたというのは、
AIの“地頭の良さ”そのものが変わった と言ってもよいと思います。


MathArena Apex──数学オリンピック級の難問でも Gemin3 の圧勝

次に目を奪われたのが、数学系ベンチマークの最高峰と言われる MathArena Apex

GPTが 1.0% に対して、Gemini 3 は 23.4%
衝撃的な差です。

GeminiベンチマークMathArea Apex

このベンチマークで面白いなと思ったのは、「データ汚染(カンニング)」に関してです。
AIの学習データに過去の問題を含んでいる場合もあると本当の実力は図れないため、問題が AIの学習後に作られた“汚染されていない”問題 で構成されているそうです。

つまり、暗記ではなく、
その場で論理を構築して解く “真の推論力” を計測 しているんです。

これを知った瞬間、私は思わず「なるほど…」と声に出してしまいました。
当たり前といえば、当たり前ですが、なかなか奥が深いです。


ScreenSpot-Pro──ここまで来たか…“画面を理解するAI”

そして今回、個人的にもっとも驚いたのは ScreenSpot-Pro です。

GPT が 3.5% に対し、Gemini 3 はなんと 72.7%

GeminiベンチマークScreenSpot Pro

これは、
画面(GUI)を見て
「何を、どこで、どうやってクリックすべきか」
を理解できるかどうかを測るテストです。

人間なら、
“初めて見るソフトでも、なんとなく操作できる”
あの直感的な理解。

これを、AI ができるようになってきているのです。

システム部の仕事に従事していた私にとって、これはまさに“衝撃”でした。

プログラミングであれば、
設計書という“プロンプト”を与えて実行する──
これはAIと相性がよく、精度が高くて当然。

しかし「画面だけを見て理解する」というのは、人間に近づいた象徴です。
ここに、生成AIの未来の広がりを感じました。


■ AI研究者たちの実験も続々。スポーツの“コーチ”まで務める時代へ

すでに YouTube などでは、AI研究者やエンジニアが Gemini 3 を試しており、
口々に「別次元」とコメントしています。

中でも印象的だったのが、

テニスのプレー動画を基に、フォームの改善点をAIがアドバイスする

という実験です。

動画を読み解き、姿勢や重心、スイング軌道を解析し、
プロコーチのように改善案を提示する。

思わず、「これはもうプライベートレッスンだ…」と呟いてしまいました。

医療、スポーツ、教育──
様々な分野で大きなビジネスになっていくのではないか。
そんな未来の風が、吹いている気がします。


■ 私も実際に試してみました──小説を書かせたら、思わず続きを読みたくなった

前述した、MathArena Apex や ARC-AGI-2 のような推論力の向上は創作分野にも応用されるとのことで、私もさっそく小説を書かせてみました。

使用したプロンプトはこちら。

次の点を考慮して、小説を書いてください。
・主人公は銀行の社員で、システム部に所属し、上流の要件定義を担当
・ユーザとの打ち合わせで、大学時代の友人(異性)と偶然再会
・主人公はその友人に想いを寄せていた
・出会った時、非常に驚いたと共に、嬉しかった
・出会った時の部分を小説に書いてください


この設定で、ChatGPT と Gemini 3 の両方に小説を書いてもらいました。

ChatGPT が書いた小説

— start —

— end —

ChatGPT の作品は、柔らかい光の描写や心の揺れが丁寧に書かれていて、
読んでいて自然と情景が浮かびました。

再会した瞬間の、
「胸の奥に眠っていた感情が息を吹き返す」
という表現が、とても印象的でした。

「続きが読みたい」と素直に思える力作です。


Gemini 3 が書いた小説

— start —

小説:要件定義の向こう側

東京・大手町。高層ビルの24階にある第3会議室の空気は、張り詰めていた。

「次期住宅ローンシステムの査定フローについてですが、前回の課題管理表のNo.12から詰めさせてください」

私は手元の資料に視線を落としたまま、乾いた声で切り出した。 私の名前は、相沢 湊(あいざわ みなと)。メガバンクのシステム部で、主にローン領域の要件定義を担当している。システム開発の上流工程は、まさに言葉の格闘技だ。ユーザ部門である営業企画部が何を求めているのか、それがシステム的に実現可能なのか、その落とし所を探る日々。

今日の打ち合わせは特に重い。ユーザ側から追加要望が出ているが、開発工数を考えるとこれ以上のスコープ拡大は致命的だ。どうにかして説得するか、代替案を飲んでもらわなければならない。

「失礼します。営業企画部の担当者が代わりましたので、本日より同席させていただきます」

先方の課長の声と共に、会議室の重い扉が開いた。 私は内心で溜息をつきながら、名刺入れを手に立ち上がった。担当変更はプロジェクトのリスク要因だ。また一から仕様の説明が必要になるかもしれない。

「はじめまして。本日より担当いたします……」

その声を聞いた瞬間、心臓が大きく跳ねた。 資料に向けていた視線を、恐る恐る上げる。

そこにいたのは、きっちりと髪をまとめ、紺色のオフィスカジュアルに身を包んだ女性だった。しかし、その面影は、私が知っている「彼女」そのものだった。

「……冬月です。よろしくお願いいたします」

冬月 遥(ふゆつき はるか)。

「え……?」

私の口から、情けない声が漏れた。 彼女もまた、私と目が合った瞬間、ビジネス用の柔らかな微笑みを一瞬で凍りつかせ、そして次の瞬間、大きな瞳を見開いた。

「相沢……くん?」

会議室の無機質な空調の音が、ふっと遠のく。 そこはもう、大手町のオフィスではなかった。私の脳裏に広がったのは、陽の光が差し込む大学の図書館と、古い紙の匂い。そして、隣で屈託なく笑う彼女の横顔だった。

大学時代、同じゼミだった彼女。 議論が好きで、少し頑固で、でも誰より誠実だった彼女。 そして、私が4年間ずっと想いを寄せ続け、結局その一言を伝えられなかった、初恋の人。

卒業してから5年。まさか、同じ会社の、しかもシステム部とユーザ部門という立場で再会するなんて。

驚きで思考が停止しそうになる中、胸の奥から熱いものが込み上げてきた。それは、予期せぬトラブルへの焦りなどではない。 単純で、純粋な喜びだった。 元気そうだった。大人びて、素敵になっていた。そして何より、また彼女に会えた。

「お知り合いですか?」

ユーザ側の課長が不思議そうに尋ねる声で、私は現実に引き戻された。 私は慌てて居住まいを正し、震えそうになる声を必死に抑えて答えた。

「あ、はい。……大学時代の、同期です」

「そうでしたか! それは心強い。システム部の相沢さんは優秀ですから、冬月さん、頼りにしていいですよ」

「……はい。ふふ、まさかこんなところで会えるなんて」

遥がふわりと笑った。その笑顔は、大学時代のあの頃と少しも変わっていなかった。 ただそれだけで、この数ヶ月間、デスマーチ予備軍としてすり減っていた私の心が、一気に潤っていくのがわかった。

「こちらこそ。……お手柔らかにお願いします、冬月さん」

私は努めて冷静に、けれど目元だけで精一杯の歓迎の意を込めて言った。 彼女もまた、小さく頷き返す。

二人の間にある机の上には、膨大な要件定義書と課題管理表。 しかし、今の私にはそれが、これから彼女と一緒に作り上げていく未来の設計図のように思えてならなかった。

プロジェクターの光が、二人の再会を静かに照らしていた。

— end —

一方で、Gemini 3 の作品は、
より“構造化された物語”で、システム部の会議の空気感や、
仕事としての緊張感の描写が非常にリアル。

ふたりの再会シーンの直前までの積み重ねが丁寧で、
「物語としての完成度」が高いのが特徴でした。
時系列がちょっと違和感ある部分もありましたが。

同じプロンプトでも、
これほどアプローチが違うのかと、思わず唸ってしまいました。


■ 生成AIはどこへ向かうのか

こうして改めて Gemini 3 の結果を眺めていると、
AI が「人間の知性の近く」に歩み寄っていることを感じます。

抽象的なパターンを理解し、
数学的な洞察を深め、
画面の意味を読み取り、
動画から人の動きを理解し、
小さな文章からでも意図を読み取る。

私がシステム部の会議室で、ユーザと対話しながら
“言葉の奥にある意図” を探るあの感覚に、
AI が少しずつ近づいているのだとしたら──

それは技術というよりも、
一種の“新しい相棒”の誕生のようにも思えます。

これからの生成AIは、
私たちの仕事や生活の中に、
そっと寄り添う存在になっていくのかもしれません。

そんな未来の気配を感じた一日でした。

ABOUT ME
Kiyoppi
Kiyoppi
こんにちは!「50代からのセミリタイヤ生活!」へようこそ。 金融系システムエンジニアとして、長年忙しい会社員生活を送ってきました。仕事に追われる毎日を過ごしていたためお金を使う時間がほとんどなかったこと、また自分では意識していなかったものの節約志向が高かったこと、加えて20代から行ってきた株式投資での幸運もあったことから一定程度の資産を築くことが出来ました。 50代半ばを迎え、もう少し自分や家族のための自由な時間を持ちたいという思いから定年前に会社員をやめ、現在は個人事業主としてゆるめにお仕事を行っております。 ここでは、実際にセミリタイヤ生活を始めた私が、実践してきた節約・投資のノウハウや、セミリタイヤ後の生活について発信してきたいと思います。 ※投資は自己責任です。ご自身で責任をもってご判断をお願いします。 https://x.com/kiyoppiX
RELATED POST