Google I/O 2026 Geminiの反撃【前編】【AI活用術】

2026-6-1
ITビジネス
Google I/O 2026 Geminiの反撃【前編】【AI活用術】はコメントを受け付けていません

Google I/O 2026の基調講演の様子。Sundar Pichai氏が登壇している場面。

シリーズ「AI活用術」の第4回、第5回は、Google Geminiの最新動向として、米国で開催されたイベント「Google I/O」での発表を中心に取り上げたい。前編・後編の2回に分けてお届けする。発表内容が幅広く盛りだくさんで、2026年5月の執筆時点で今年最大級のAI関連イベントになりそうである。

〇AI活用術
第１回　「AIが勝手にやってくれる」時代に〜2025年AIの進化を振り返る〜
https://itlifehack.jp/archives/10964715.html

第２回　自分専用の有能な秘書！「NotebookLM」を究めよう
https://itlifehack.jp/archives/10971125.html

第３回　AIが“自分の仕事を代わって実行する”──「Agent Skills」の効用
https://itlifehack.jp/archives/10985661.html

■AIエージェント時代の進展とGoogle Gemini
このイベントでの発表をひと言で言うと、Geminiの本格的AIエージェント化といえそうだ。以前のGeminiはChatGPTなど他のAIと同じように、「質問に答えてくれる物知り」というような存在だったが、本シリーズで追いかけているようにAIがあなたに代わって少しずつ高度な仕事を肩代わりしてくれるようになってきたのである。Geminiもまさにその方向に進化している。少しこのトレンドをふりかえってみよう。

たとえば、前回（本シリーズ第3回）ではAIに業務手順を覚え込ませる「Agent Skills」という仕組みを取り上げた。2026年2月初旬、米AI企業AnthropicのClaude CodeやCoworkの相次ぐ発表で「SaaS系企業の株価が軒並み暴落」という騒動が起きた話にも触れた。事務職がSaaSでこなしている業務をAIが置き換えると見た多くの株主が、関連株を一斉に売ったためと思われる。それからまだ3ヶ月しか経っていない。AIエージェントの分野ではAnthropicが一歩抜け出したかに見えていた。

もちろんChatGPTのOpenAIも、Anthropicの成功に刺激を受け、機能強化したCodexアプリを市場に投入し、エンジニアのみならず、一般事務職の仕事をAIエージェントが肩代わりするトレンドに一層拍車をかけている。

では、肝心のGoogleはどうか。Geminiは、いまやGmailはもちろん、Google Workspaceの文書作成、スプレッドシート、スライド作成、Google Driveなど、ほぼ全アプリのサイドバー（画面の右端が多い）に常駐するようになった。そして、ChromeブラウザやYouTubeにもGeminiが統合された。Google MapsにもやはりGeminiが統合され、「Ask Maps」という10年ぶりの大刷新が入った。シリーズ第2回で取り上げた情報整理ツール「NotebookLM」は大人気になり、この1年で15億ものノートブックや音声解説、スライドなどの各種アウトプットが作られた。これも人気の画像生成モデル「Nano Banana」は500億枚もの画像を世に送り出している。チャットアプリとしてのGeminiの月間アクティブユーザー数（MAU）は、わずか1年で4億人から9億人へと倍以上になった。

さらにスマートフォンの分野では、ライバルであるAppleがAIにGoogleの技術を採用するという衝撃のニュースが飛び交った。Appleは年間およそ10億ドルを支払い、Googleから1.2兆パラメータの専用Geminiモデルのライセンスを受けるという。今年後半、次世代Siriの中身はGeminiになる予定だ。

そんなところに、毎年恒例のGoogleの開発者会議「Google I/O 2026」が開催された。その基調講演（日本時間5月20日未明）で発表されたGeminiを中心とするサービス群は事前の予想を上回り、SNSでは世界中でこれを歓迎する「祭り」が始まった。本稿では、その中から特に注目したい発表内容を取り上げて紹介したい。ひと言で言えば、GoogleはAIを「面」で押さえに来た。基盤モデル、個人、仕事、Android、メガネ、検索、クリエイティブ──Googleはその強みを活かし、私たちの日常のあちこちのシーンでGeminiをあなたの強力な秘書にしようとしている。

■Geminiモデルの新世代 ── Gemini 3.5 Flash と Gemini Omni
I/O 2026の基調講演でまず発表されたのは、Geminiシリーズの新モデル2つだった。汎用AIの最新版「Gemini 3.5 Flash」と、動画・画像など生成系の新世代モデル「Gemini Omni」である。前者は本稿でこれから紹介する多くの機能の土台になり、後者はクリエイティブ分野（後述）でGoogleの強みを一気に押し上げる。

〇Gemini 3.5 Flash ── フロンティア級なのに、速くて、安い
「Flash」はGeminiシリーズの中で軽量・高速を担当するモデルだ。今回のバージョン3.5は、軽量モデルでありながらフロンティア級（最先端の大型モデル）に並ぶ性能を達成したという。出力速度は他社のフロンティアモデルと比較して4倍速く、価格は同等性能のモデルの半額以下だ。これまでコスト面で諦めていたAI活用にも踏み出しやすくなりそうである。Gemini 3.5 Flashは2026年5月20日から、Geminiアプリ、Google Workspace、APIなどGeminiを使う全製品で利用できる。

〇Gemini Omni ── 動画と画像、ひとつのモデルで作って編集する
もうひとつ発表されたのが「Gemini Omni」である。Google DeepMind（GoogleのAI関連研究開発担当子会社）のCEO、Demis Hassabis氏が自ら登壇し、Omniを「あらゆる入力からあらゆる出力を生成できる新モデル」と紹介した。

これまでGoogleは、動画生成の「Veo」、画像生成の「Nano Banana」、インタラクティブな3D空間生成の「Genie」など、目的別に複数の生成AIを開発してきた。Omniはこれらの能力をひとつのモデルに統合し、テキスト・画像・動画を自由に組み合わせて入力・出力できるようになった。

運動エネルギーや重力といった物理現象の理解が大きく前進した点がアピールされていた。「タンパク質の折りたたみを粘土アニメで解説する動画を作って」のような複雑な指示も、自然な動きの動画として出力する。

登場人物の一貫性や、アルファベットの表示はかなり向上している。日本語の文字も表示できるようになったが、残念ながらまだ安定しているとは言えない。しかし、大きく一歩前進したとは言えそうだ。

Gemini Omniが生成した動画の一場面。日本語の文字が表示できているが、ところどころあやしい。

Omniで生成した動画の場面、もう一例。

【動画】
新橋居酒屋

YouTube：https://youtu.be/sN4PjPlL0Qc

会話形式で動画を編集できることも大きい。動画を「生成する」AIだったVeoから、「会話で編集する」AIへとOmniは大きく一歩進んだ。

2026年5月20日から、Gemini Omniシリーズの最初のモデル「Gemini Omni Flash」が、Geminiの有料サブスクリプション（Google AI Plus、Pro、Ultra）の利用者向けに、Geminiアプリ内で提供される。さらに上位の「Omni Pro」も近日中に提供される予定だ。

〇Gemini 3.5 Pro は6月リリースか

なお、Sundar Pichai氏（GoogleのCEO）は3.5 Pro（より高性能な上位モデル）についても「Google内部で使っており、大きな改善を感じている。翌月（6月）にはお届けする」と予告した。楽しみである。

■「あなたの文脈」を理解するAIへ ── Personal Intelligence と Workspace Intelligence
これまでのAIアシスタントには共通の弱点があった。「あなたのことを知らない」ことだ。つまり、質問するたびに、自分の状況や背景を一から説明し直す必要があった。Googleは、個人向けのGemini AIに「Personal Intelligence（パーソナル・インテリジェンス）」、企業向けのGoogle Workspaceに「Workspace Intelligence（ワークスペース・インテリジェンス）」という対になる2つの「文脈AI」を組み込み、この弱点を解消しようとしている。どちらもI/O 2026以前から段階的に提供が始まっていた機能である。後述するAIエージェント機能と並ぶ、Geminiの戦略の核と言える。

〇Personal Intelligence ── あなたのGmailや写真から、ふさわしい提案を返す
Personal Intelligenceは、Geminiに統合された個人向けの機能だ。後述するWorkspace Intelligenceとほぼ同時期に提供が始まっており、利用者が許可した範囲でGmail、Googleフォト、カレンダーなどのアプリと安全に接続し、Geminiの応答を「あなたに合わせた」ものにする。

基調講演で紹介された具体例の一つは、新しいGoogle検索のAIモードで家族の週末プランを聞くシーンだ。「子供と楽しめる近場のお出かけ先を考えて」と話しかけると、GeminiはGmail（過去の予約や領収書）・Googleフォト・Googleカレンダーを参照し、子供の好みや習い事まで踏まえた提案を返した。

〇Workspace Intelligence ── 仕事の「社内文脈」をGeminiに渡す基盤
一方、企業の利用者にとって重要なのが「Workspace Intelligence」である。これはI/O 2026に先立つ2026年4月のGoogle Cloud Next '26で発表され、4月22日から段階的に提供が始まっている機能だ。

簡単に言えば、Gmail、チャット、カレンダー、Google Drive、Googleドキュメント、スプレッドシート、スライドにある社内の情報を、Geminiが「文脈」として理解した上で答えてくれるようになる仕組みである。これまでなら毎回プロンプトに資料を貼り付けたり、長い前提説明をしたりする必要があった作業が、「いつもの仕事の続き」としてGeminiに頼めるようになる。

たとえばGoogleドキュメント内で社内データに基づく文書を作る、Googleスプレッドシートで自然言語から表や数式、ピボットテーブル、グラフを生成する、Googleスライドで会社の標準デザインに沿った編集可能なプレゼン資料を一括生成する──こうしたことが、社内の関連資料を参照しながらGeminiにより自動で処理される。

セキュリティ面の設計も重要だ。管理者は、Gmail・Drive・カレンダー・チャットのどの情報源をGeminiに使わせるかを制御できる。ユーザーが閲覧権限を持たないデータは参照されない。さらに、利用したデータは広告目的にも、生成AIモデルの学習にも使われない仕様になっている。

〇文脈データの真ん中にGeminiが座る ── Googleにしかない優位性
Personal IntelligenceもWorkspace Intelligenceも、Googleが長年積み上げてきたサービスと利用者データの上に成り立っている。Gmail、Googleフォト、Google Drive、Googleドキュメント、スプレッドシート、スライド、カレンダー──個人生活と仕事の情報が、すでにGoogleのなかにある。そこにGeminiが入って、文脈データに最短距離でアクセスできる構造ができた。他社のAIが同じことをしようとすると、外側からネットワーク経由で接続する形になり、速度や連携の細かさで差が出てくる。

Geminiが個人と仕事の情報の真ん中に座る構造。他社のAIエージェントが外側からMCPで接続するのに対し、Geminiは最短距離で文脈データに触れられる。GPT image 2を使用して生成。

AIエージェントの世界はこれまでAnthropicとOpenAIが先行してきた。Googleの反撃の勝ち筋は、AIモデルの性能向上だけではなく、AIエージェント化と「文脈AI」の組み合わせにあるだろう。

〇現状：情報の壁に違和感あり
便利な仕組みだが、注意点もある。Workspace Intelligenceが文脈として読み込めるのは、Gmail・チャット・カレンダー・Drive・ドキュメントなどに限られ、GoogleフォトやYouTubeは対象外だ。写真や動画素材を業務で多用する人も多いはずだが、現状の仕様では利用範囲にない。今後の対象サービス拡大に期待したい点である。

■「待望の一般事務職向けAIエージェント」Gemini Spark
冒頭で、AIエージェントの分野ではAnthropicやOpenAIが先行していると書いた。Googleからも、いよいよ待望の一般ユーザーが利用できる本格的AIエージェントが登場する。I/O 2026で発表された「Gemini Spark」である。

Sundar Pichai氏は基調講演でSparkを「あなたの代わりに動くAIエージェント」と紹介した。指示を出したら結果を持ち帰ってくる、文字どおりの仕事の代行役である。しかもSparkはクラウド上で動作し、利用者がラップトップを閉じても、スマホをロックしても、バックグラウンドで動き続ける。Googleはこれを「24時間ノンストップで稼働するパーソナルAIエージェント」と紹介している。

注目したいのは、Sparkがエンジニアではない一般事務職に向けたAIエージェントだという点だ。これまで、プログラミングを書けない一般事務の人が業務を自動化したいと思っても、高いお金を払って業者に委託するか、最初から諦めるかしかなかった。それがようやく、自分自身の手で組めるようになる。

決め手は、Sparkで「スキル」が使えることだ。スキルは本シリーズ「AI活用術」の第3回で詳しく取り上げた、AIに業務手順を覚えさせる仕組みである。スキルにより、AIが仕事の手順、つまりワークフローを覚え、自律的に実行できるので、業務の自動化や効率化に貢献できるのだ。

スキルはユーザーがAIに依頼することで、AIが設計、開発、そしてメンテナンスが可能である。しかもスキルの中に必要に応じてAIがプログラムを埋め込むことができるので、ユーザーはそのようなシステムの仕組みやプログラミングの知識を全く知らなくてもかまわない。すべてAIに任せられるのである。こうした特徴のおかげでプログラマーやエンジニアではない、一般の事務職でも自分の仕事を効率化させるためのスキルを作れ、自動化システムなどを実行できる。

スキルは、Googleのツールとしては、エンジニア向けのAI開発支援ツール「Antigravity」で以前から使えていたが、Sparkでようやく一般利用者にも使えるようになる。AIエージェントを業務に組み込むための道具が、Googleにも一通り揃ったことになる。

〇デモ：パーティの段取りを全部任せる
基調講演ではJosh Woodward氏が、ご近所が集まるパーティの準備の支援をSparkに頼むデモを見せた。「出欠返事を集めて、持ち寄り品のリストを作って、未返事の人には催促メールを送って」という指示ひとつだ。

SparkはGoogleの各サービスを横断して動いた。Googleスプレッドシートに出欠表が生成され、Gmailと接続されて返事が届くたびに自動更新される。催促メールはGmailの下書きとして用意され（送信は人間の承認が必要）、イベント告知用のスライドはGoogleスライドに、自治会の規約はGoogle Driveから引っ張ってきた。ひとつの指示で全部進む。これが、Sparkが目指す「働き続けるAIアシスタント」の姿だ。

基調講演公式動画より。Gemini Sparkにパーティの準備を手伝うように頼んだところ。

〇AI大手3社の一般事務職向けAIエージェントがいよいよ出揃い、激しい競争へ
Sparkは2026年5月19日から信頼できるテスター向けに、5月26日からは米国のGoogle AI Ultra加入者向けにベータ版として提供が始まる。WebブラウザのGeminiアプリのほか、Androidスマホ・iPhoneのGeminiアプリでも使える。今夏には、MacのデスクトップアプリにSparkが統合され、パソコン内のファイルを使った作業もSparkに任せられるようになる予定だ。Windows版のデスクトップアプリへの統合は今のところ発表されていない。

これで、AI大手3社の一般事務職向けAIエージェントが出揃う。AnthropicのClaude Cowork、OpenAIのCodex、そしてGemini Spark。3社の競争がますます激しくなる。ユーザーとしては、利便性と実行力の向上に期待したい。

■AndroidのGeminiもエージェントに　「Gemini Intelligence」
I/O 2026の直前、5月13日のGoogle「Android Show 2026」で、Androidスマホ向けのGemini機能群「Gemini Intelligence（ジェミニ・インテリジェンス）」が発表された。さらに5月20日のI/O 2026基調講演でも追加発表があった。Geminiが「面」で押さえに来たGoogleの戦略のなかで、もっとも多くの人の手元に届くのが、Androidである。

Gemini Intelligenceは、まずはGalaxy S26とGoogle Pixel 10に先行搭載され、今年後半にかけて他のAndroidスマホ、Wear OSのスマートウォッチ、車、メガネ、ラップトップへと広がっていく。

また、同時に発表されたGoogleの新しいノートPCカテゴリー「Googlebook」は、このGemini Intelligenceのためにゼロから設計されたとされており、注目である。今年秋に登場予定である。

〇日常作業をAIエージェントのGeminiが代行する
Androidスマホの中で、Geminiがアプリをまたいだ作業を代わりにこなすようになる。たとえばホテルのロビーで気になった旅行パンフを写真に撮り、「6人で行けるツアーをExpedia（旅行アプリ）で探して」と頼むだけで、Geminiが裏でExpediaを開いて条件に合うプランを探してくれる。料理アプリや配車アプリへの対応も加えられた。

ChromeブラウザにもAIエージェントのGeminiが入る。Webを横断した調べ物のまとめや、複数の予約サイトを巡る空き状況比較といった、これまで手動でやっていた調査作業を代行する。Webサイトの自動入力（Googleの「自動入力」機能）も、前述のPersonal Intelligenceと連動して賢くなり、スマホの小さな画面で長いフォームを埋めるストレスから解放されそうだ。

〇自分専用のウィジェット（＝ミニアプリ）を作る「Create My Widget」
特に面白いのが「Create My Widget」だ。「週3回の高タンパクなレシピを提案するウィジェット」「風速と雨だけ表示する天気ウィジェット」のように、自然言語で頼むだけで、自分の好みに合わせた専用ウィジェットがホーム画面に作られる。Wear OSの時計でも使える。

Googleはこれを「Generative UI（生成型UI）の最初の一歩」と位置づけている。AIが、あらかじめ決まったレイアウトデザインで画面を表示するだけでなく、ユーザーの要望に合わせて画面そのものを生成する技術のことだ。Generative UIについては本稿の後半で改めて取り上げる。

「Create My Widget」のデモの様子。Android Showの公式動画から。

〇Android向けのその他の新機能
Android Showでは他にもいくつかの新機能の発表があった。

「Rambler」は、言い淀みや多言語の切り替えを含む音声を、Geminiがその場で読みやすい文章に整えてくれる機能だ。長文メールの口述などに役立つ。スマホでのテキスト入力やAIへのプロンプト入力を大きく変えそうだ。

「マジックポインタ」は、マウスカーソルをあてた対象を「これを」「こちらに」とGeminiに口頭で指示できる機能だ。前述の「Googlebook」に先行搭載され、その後「Gemini in Chrome」にも展開予定だ。

「Android Halo」はスマホ画面上部の細い帯で、Geminiが「いま何をしているか」を一目で把握できる仕組みである。今年後半に登場予定だ。

以上のように、AndroidのGeminiもエージェント化し、これまでのような「写真の加工」やメールの下書きにとどまらないパーソナルアシスタントとして強化される見込みだ。

iPhoneのApple Intelligenceに搭載が予定されるGeminiの機能も気になるが、スマートフォン全般のAIエージェント化が本格的に始まる年になりそうだ。

本稿の前編はここまでとする。後編では、スマートグラス、Google検索の大幅な刷新、そして動画・画像・Webデザインなどクリエイティブ系の新ツールを取り上げる。

テクニカルライター　鈴木啓一