Google I/O 2026 Geminiの反撃【後編】【AI活用術】

  • 2026-6-2
  • Google I/O 2026 Geminiの反撃【後編】【AI活用術】 はコメントを受け付けていません
Google-io2026
Google I/O 2026の基調講演の様子。Sundar Pichai氏が登壇している場面。

シリーズ「AI活用術」第5回は、Google I/Oでの発表を中心にお届けしている、Geminiの最新動向記事の後編である。前編では、Gemini本体のモデル更新、Personal IntelligenceとWorkspace Intelligence、一般事務をこなすエージェントの本命Gemini Spark、AndroidスマホでのAIエージェント化を取り上げた。後編では、スマートグラス、Google検索の大幅な刷新、クリエイティブ系の新ツールに関する発表を解説していく。

〇AI活用術
第1回 「AIが勝手にやってくれる」時代に〜2025年AIの進化を振り返る〜
https://itlifehack.jp/archives/10964715.html

第2回 自分専用の有能な秘書!「NotebookLM」を究めよう
https://itlifehack.jp/archives/10971125.html

第3回 AIが“自分の仕事を代わって実行する”──「Agent Skills」の効用
https://itlifehack.jp/archives/10985661.html

第4回 Google I/O 2026 Geminiの反撃【前編】
https://itlifehack.jp/archives/11004341.html

■インテリジェントアイウェア「Android XR」がいよいよ今秋登場
「Android XR」は2024年末にGoogleがSamsung、Qualcommと共同で発表した拡張現実向けプラットフォームだ。拡張現実とは、目の前の現実世界に、地図や翻訳といったデジタル情報を重ね合わせる技術のことを指す。昨年のI/O 2025では、これを搭載したスマートグラスのプロトタイプが基調講演でステージ実演された。そして今回のI/O 2026で、ついに消費者向け製品としての具体的な提供会社と販売時期が発表された。Googleはこのメガネを「インテリジェントアイウェア」と呼んでいる。スマホをポケットから出さなくても、視界や耳元にいつでもGeminiが現れ、日常を手伝ってくれる。

〇2種類のアイウェア ── 今秋はオーディオから
インテリジェントアイウェアには2種類ある。レンズに小さなディスプレイが入った「ディスプレイグラス」と、耳元でGeminiが小声でサポートしてくれる「オーディオグラス」だ。先に米国で今年秋に発売されるのはオーディオグラスである。

〇デザインと販売はGentle MonsterとWarby Parker
その「オーディオグラス」で、今わかっていることは以下のとおりだ。

フレームのデザインと、店頭での販売を担うのは、韓国発のアイウェアブランド「Gentle Monster」と、米国の「Warby Parker」だ。両ブランドとも、ファッション性の高いアイウェアで世界中にファンを持つ。一日中違和感なく掛けていられる、おしゃれな普段使いのメガネとして仕上がる見込みだ。レンズの度数合わせなど、専門ブランドならではの調整サービスは本職のアイウェアブランドが担う。本体はSamsungがプラットフォームから一緒に開発し、処理を担うチップにはQualcomm社のSnapdragon(高性能なスマホ向けプロセッサ)が使われる。GoogleはAIの提供と全体のとりまとめに専念するかたちだ。

GentleMonster
Gentle Monster製のインテリジェントアイウェア。ファッション性の高い普段使いのメガネとして仕上がる。


Warby Parker
Warby Parker製のインテリジェントアイウェア。米国発のアイウェアブランドが手がける。


〇主な機能
オーディオグラスで提供される主な機能は次のとおりだ。

a. 搭載されたカメラを使い、目の前のもの(看板、雲、建物など)についてGeminiに尋ねる
b. 向いている方向を理解した、自然な道案内
c. 写真・動画の撮影と、Geminiへの送信
 GeminiがNano Banana(画像生成・編集AI)による即時編集を行い、スマートウォッチに送ってプレビューすることも可能
d. 話し相手の声色に近い音声でのリアルタイム翻訳
e. その他

〇iPhoneでも使える
注目したいのは、このインテリジェントアイウェアがAndroidスマホだけでなく、iPhoneともペアリングして使える点だ。iPhoneユーザーの多い日本ではうれしい情報である。

〇基調講演デモ ── 「先週、友人のGiannaと会った場所まで案内して」
Google I/Oのステージで実演されたNishtha Bhatia氏のデモは、Geminiとの単なる会話だけでなく、「いつもの」自然な会話で、メガネのGeminiが背景や文脈情報を補って多様なサポートをしてくれる場面を見せた。その下支えになっているのが、前述のPersonal Intelligence(個人の文脈AI)である。

メガネを掛けたNishtha氏は、メガネ内で起動しているGeminiに話しかけた。スマホは取りだしていない。
「先週、友人のGiannaと会った場所まで案内して」
Nishtha氏は、先週訪れた場所にもう一度行きたいようだ。

場所の固有名詞は伝えていないが、GeminiはGoogleフォトやカレンダーから先週のハイキングを思い出し、「先週訪れたRedwood Grove自然保護区へのルートを設定しました」と返答。そのうえで「途中の寄り道に、いつもの午後のコーヒー(コールドブリュー)を買うお店を入れますか?」と提案までしてきた。「いつもの」コーヒーの好みもPersonal Intelligenceが覚えている。

「お願い、ついでにそのカフェに私のいつもの注文を入れておいて」とNishtha氏が頼むと、Geminiはポケットの中のスマホで「Doordash」を立ち上げた。Doordashは米国で出前と店頭受け取りの両方に対応している大手の注文アプリだ。Geminiは画面遷移を自動でこなし、店頭受け取り注文の確認画面の手前まで運んで、Nishtha氏の承認を待つ。彼女が承認の操作をし注文が店に届けば、寄り道のカフェに着く頃にはコーヒーが用意されている、という段取りだ。

このあとデモでは、未読メッセージから夕食予定を拾ってカレンダーに登録する場面や、メガネのカメラで撮った写真をNano Banana(Geminiの画像生成・編集機能)で漫画風に編集、スマートウォッチに表示する場面も披露された。

Nishtha01
基調講演動画から。メガネ内のGeminiがスマホを操作し、カフェに注文を送信しようとしているところ。この段階ではNishtha氏はスマホを取り出しておらず、彼女のポケットの中にある想定。


Nishtha02
メガネのカメラで撮影した観客の写真をNano Bananaで編集し、スマートウォッチに表示したところ。


普段のメガネを掛ける感覚そのままで、Geminiがいつでもどこでもあなたをアシストする。米国での発売は今年秋から、日本での展開時期は未発表だが、スマホを取り出さなくてもAIが手伝ってくれる時代がもうすぐ来そうだ。

■Google検索がさらに大きく変わる
Google I/O 2026の基調講演で、Google検索担当バイスプレジデントのLiz Reid氏が登壇し、Google検索の大幅な刷新を発表した。検索エンジンとAIをひとつにまとめる、その次の一歩だという。いま私たちが知っている検索の姿は、ここからさらに変わっていく。

〇約25年ぶり、検索ボックスの刷新が始まっている
検索の入口である検索ボックスだが、Google検索の登場以来最大級の刷新がおこなわれつつある。ご存じのように「AIモード」と呼ばれる機能がその第一歩だ。検索窓にキーワードを入れるのではなく、自然な言語で質問を書き込むと、それにAI(つまりGemini)が答えてくれるというものだ。

今回発表されたのは、その検索ボックスにテキストだけでなく画像、ファイル、動画、Chromeで開いているWebページも一緒に渡して質問できるようになる、という機能拡張だ。これまでGoogle検索が「インターネットから情報を探す場」だったのに対し、これからは「自分の手元の情報をもとにAIに作業してもらう場」にもなる。もはや「検索」より「質問」や「依頼」と呼んだほうがしっくりくる。

基調講演で示された具体例は、こんな感じだ。「近場のハイキングコース」と短く聞くのではなく、「眺めの良い、犬OKのトレイルでハイキング1日プランを作って、便利な駐車場のあるランチスポットも入れて」と依頼する。

検索ボックス自体も、長い質問を打ち込むとその分自動で広がり、質問の途中で聞き方を補う提案も入るようになるという。

〇24時間あなたの代わりに見張る「検索エージェント」
Google検索の中でも、複数のAIエージェントを作って動かせるようになる。その第一弾「情報エージェント」は、バックグラウンドで24時間休まず動き、Web上のニュース、SNS、ショッピング、金融などのリアルタイム情報を見張ってくれる。たとえば希望の条件に合う賃貸物件が出たら通知が届く、といった使い方ができる。今年夏、米国でGoogle AI ProとUltraの加入者向けに提供開始予定である。

予約代行の領域も広がる。家の修繕、美容、ペットのケアなど、店に電話で確認するしかなかった種類の予約も、Google検索が裏で店舗に直接電話までかけて段取りを取ってくれるようになる。米国でこの夏から順次提供予定だ。

〇触って試せる説明図が、質問のたびに作られる
検索結果の見せ方も大きく変わる。基調講演では「ブラックホールは時空にどう影響するのか?」という質問のデモが示された。文字の説明にあわせて回答の中にインタラクティブな図が現れ、続けて「重力波がどう生まれるかを見せて」と聞くと、Geminiがその場で新しい説明図を組み立てる。スライダーで軌道距離や質量比を動かせば、重力波の形がリアルタイムに変わっていく。「読んでわかる」だけでなく「触ってわかる」答えが、検索結果の中に直接出てくるようになる。

Blackhole01
「ブラックホールは時空にどう影響するのか?」という質問に対し、Geminiがその場で組み立てたインタラクティブな説明図。


Blackhole02
スライダーで軌道距離や質量比を動かすと、重力波の形がそれに合わせ変わっていく。


専門家はこの仕組みを「Generative UI(ジェネレイティブ・ユーアイ、生成型UI)」と呼ぶ。あらかじめデザイナーが用意した画面を表示するのではなく、AIが質問のたびに画面そのものをその場で組み立てて表示するのが特徴で、今後の大きな技術トレンドのひとつになりそうだ。前述のAndroidの「Create My Widget」もあわせ、GoogleはこのGenerative UIの最初の一歩と位置づけていた。

この機能は今年夏、Google検索を使う世界中の利用者に向けて無料で提供開始される予定だ。結婚式の準備や引っ越しのように何週間も付き合うタスクなら、一時的な画面だけでなく専用の「ミニアプリ」を作ることが可能だ。この場合、その画面に何度も戻ってきて続きから進められる(米国のGoogle AI ProとUltra加入者から、数ヶ月のうちに開始)。

前述のAndroidの自分専用ウィジェットと、このGoogle検索の答えの画面で、「画面そのものをAIが作る」流れが、Googleの2つの場所で同時に動き出した。

〇質問する検索が広がり、Webの集客モデルも変わる
Googleによれば、米国ではこの1年でGoogle検索の使い方が大きく変わってきているという。検索の6回に1回は音声か画像で行われ、AIモードでの質問の平均文字数は従来の3倍に伸びた。「子供と楽しめる近場のお出かけ先を考えて」のような、話しかけるような長い質問が当たり前になってきた。

こうした検索スタイルの変化は、Webサイトを運営する側にも大きく響いてくる。キーワードを並べた検索の時代に最適化されてきた「SEO(検索エンジン最適化)」は、ここ1〜2年で大きな転換を迫られている。GeminiがWebから答えそのものを返すようになると、利用者はリンクを次々クリックしなくなる。WebメディアやEC各社の世界では、すでに集客モデルの作り直しが始まっている。

さらにこの傾向は大きく進んでいきそうである。

■動画、画像、Webサイトまで、Geminiと作る ──「Flow」「Pics」「Stitch」
本稿の冒頭で紹介した新しい生成モデル「Gemini Omni」は、動画も画像もひとつのモデルで会話しながら編集できる、というものだった。Google I/O 2026で発表されたクリエイティブ系のツールは、このOmniやNano Bananaを土台にしたものが多い。順に紹介していく。

〇Flow と Flow Music ── 映像と音楽のAIスタジオ
「Google Flow(フロー)」は昨年のI/Oで発表された、映像クリエイター向けのAIスタジオだ。Google Labs(Googleの実験的サービスを集めた場)で公開されており、現在は世界140カ国以上で使われている。今年初めには音楽専用の姉妹版「Flow Music」も加わった。今回のI/O 2026で、両者にまとめて3つの更新が入った。

ひとつめは、前述の「Gemini Omni Flash」のFlowへの統合だ。動画における「Nano Banana」のような存在で、一枚の参考画像を渡せば16通りのカメラアングルの動画をまとめて作ってくれたり、撮影済みの映像全体を「朝の景色」から「夜のドライブ」へ一括で書き換えてくれたりする。登場人物を差し替えても、背景や演技の整合性は保たれる。

指示はひとことでも、Flowが裏で必要な編集を順番にこなしてくれるイメージだ。さらにOmniの特徴として触れた、動画の中に文字を表示できるという進化も、Flowでそのまま使える。文字の入った動画素材を作る場面が多いクリエイターにとっては、表現の幅がぐっと広がる更新と言える。

Flow01
基調講演公式動画より。FlowでOmniが、一枚の参考画像から16通りのカメラアングルの動画をまとめて生成している画面。


Flow02
自分専用のミニアプリ(カスタムツール)を作れる「Flow Tools」。あらかじめ多数用意されているミニアプリの一覧画面。


ふたつめは、その名も「Flow Agent」、創作の段階ごとに伴走するAIエージェントである。これまでFlowは一度に一つの指示しか処理できなかったが、Flow Agentは複数の作業を同時に進められる。脚本の対話案の壁打ち、複数バリエーションの一括生成、アセットの整理や自動リネームまで引き受けてくれる。映像制作の現場で「同じ素材を朝・昼・夜で書き出す」「主役の表情違いを5パターン用意する」といった面倒な雑務を、Flow Agentに任せておけるイメージだ。

そして今回の目玉が「Flow Tools」だ。Flowの中で、自分専用のミニアプリ(カスタムツール)を、コードを書かずに自然言語で作れる。古びた質感に変える映像加工や、動画の縦横サイズを変える補助ツールなど、自分の制作スタイルに合わせた小道具を組み立てられる。作ったミニアプリは他のFlow利用者と共有でき、相手はそれをアレンジして自分流に作り直すこともできる。

Flow Music側にも更新が入った。楽曲の一部だけを選んで歌詞を書き換えたり、ビートを差し替えたりできるようになり、メロディと構成を保ったまま「lo-fi study版」のようなカバーも作れる。Flow MusicからOmniでミュージックビデオを作る機能も加わった。両者にはモバイルアプリも登場し、FlowはAndroid(ベータ)から、Flow MusicはiOSから順次提供される。

筆者もFlowを触ってみたが、いまの段階では完成度というより実験室の雰囲気が強い。一方で、ミニアプリを自分で組み立てられるという発想は新鮮だ。映像・音楽のクリエイターが、自分の作業に合った道具を自前で持てるようになる意味は大きい。

〇Pics ── Workspaceに加わる新しい画像ツール
つぎはGoogle Workspaceの新製品「Google Pics(ピックス)」だ。パーティのチラシから、情報を整理したインフォグラフィックまで、さまざまな画像を作って編集できるツールである。

土台は、人気の画像生成・編集モデル「Nano Banana」だ。Picsはそこに、利用者が細かく手を入れられる機能を追加した。元の画像をPicsに読み込むと、Picsは、Geminiの画像認識の能力で、画像を要素ごとに分けて理解している。気になる箇所にカーソルを合わせてクリックすれば、その単位で削除したり、サイズを自由に変えたりが可能だ。一度Nano Bananaで生成した画像の部分修正や変更ができるのはとても便利である。画像のレイアウトが決まったあとは、文字を追加したり、別の言語に翻訳したりすることもできる。

Pics
基調講演のデモより。Google Workspaceに新しく加わった画像ツール「Pics」の編集画面。画像が要素ごとに分けて理解されているので、クリックで個別に編集できる。画面左下の部分が「足(Leg)」と認識されており、この「足」をひとかたまりとして削除したり、移動したりその他編集ができる。


出力された画像にはすべて「SynthID」というGoogleの電子透かしが入る。AI生成かどうかを後から識別できる仕組みだ。Picsの提供開始は今年夏の予定である。

Google Workspaceの中で資料や案内チラシを作る場面が多い人にとって、Picsは身近な新ツールになりそうだ。

〇Stitch ── 音声でも話しかけて作るWebサイトデザイン
「Stitch(ステッチ)」はアプリやWebサイトの画面デザインを作るツールだ。昨年のI/Oで発表され、この1年で世界中の利用者によって1億画面ものUI(ユーザーインターフェース)が生成されたという。

今回の進化は、テキストでも音声でも、新しい「Stitch Agent」と会話しながらリアルタイムで画面を組み立てていける点だ。基調講演で例として登場したのは、ピザ店を営むTylerとJennyという夫婦である。Webサイトのデザイン経験はないという2人が、ひとことのプロンプトでお店のサイトを作っていく。「ヘッダーの文字をもう少し大きく」「メニューにピザの種類をもっと並べて」と話しかければ、Stitch Agentが裏で要素を組み直し、レイアウトがその場で書き換わる。

Stitch
基調講演から。Stitchでピザ店のWebサイトをデザインしている画面。音声で話しかけるとStitch Agentが裏で要素を組み直す。


出来上がった画面は、Google AI Studio経由で共有リンクを発行できる。さらに、AI開発支援ツール「Antigravity」につないでバックエンド(裏側の処理)を足したり、自分のWebサイトを公開できる海外のサービス「Netlify(ネットリファイ)」から即座にWebに公開することもできる。これらのアップデートは、2026年5月20日から世界中で利用できる。

〇クリエイティブの現場にもAIエージェントが入った
動画と音楽がFlow、画像がPics、アプリやWebサイトがStitch。Geminiの生成モデルを土台にしたクリエイティブツールが、それぞれの分野で揃ってきた。

いずれも、利用者が大まかな指示を出せば、AIが裏で必要な作業をまとめて引き受けてくれる作りになっている。本稿でここまで見てきた他の章と同じく、クリエイティブの分野でもGeminiは「あなたの代わりに動くAIエージェント」として動き始めている。

■I/O 2026の発表に触れて、感じたこと
Google I/O 2026の発表は、Geminiとその応用製品によって大きく私たちの生活や仕事が変わりそうという話だったが、一方でAIを使う際に注意すべき点は変わらない。

ひとつは、最終決定は人間が行う、ということだ。
Sparkデモの催促メールはGmailの下書きで止まっていたし、メガネからのDoordash注文も最終承認待ちだった。もう当たり前のことではあるが、Google自身が「下書き止め」「承認待ち」の設計をしているのも確認できた。下書きを確認し仕上げて送信するのも、注文の最終決定をするのも、人間の仕事である。全部AI任せにしないやり方だ。AIに責任は取れない。
便利な機能とはいえ、AIは間違えるし、暴走してしまうことさえある。信頼するのは良いが、信頼しすぎないことが重要だろう。

もうひとつは、セキュリティやプライバシーの面だ。
AIに渡す情報と渡さない情報を、ユーザー側でしっかり意識しておくことが重要だ。Workspace Intelligenceは管理者が情報源を制御できるし、Personal Intelligenceも個人で範囲を決められる。せっかく細かい権限管理が用意されているのだから、一度は設定画面を確認しておきたい。

■AIエージェント時代、Geminiが日常のあちこちに深く入ってくる
本稿で見てきたGoogle I/O 2026の発表は、基盤モデルから始まって、個人、仕事、Android、メガネ、検索、クリエイティブと、私たちの日常を構成するほぼすべての場面に及んでいた。

そして発表されたどのサービスでも、Geminiは「物知り」を卒業して、「あなたの代わりに動くAIエージェント」へと役割を広げている。本シリーズで追いかけてきたAIエージェント化の流れは、AnthropicとOpenAIが先行する中で、Googleもいよいよ本気で乗り出してきた、と言えそうだ。

筆者がGoogleの強みだと感じるのは、これらが机上の発表ではなく、すでに何億人もが日常的に使っているGoogleのサービスの中に組み込まれていく点だ。Gmail、Google Workspace、Android、検索、Chrome──いま手元にあるものが、知らないうちにAIエージェントとして動くようになっていく。読者の中にも、「気がついたら、自分のスマホの使い方が変わっていた」という体験をする人が、今年中に何人も出てくるだろう。

もうひとつ、Geminiが急速に強くしている武器がある。Personal IntelligenceやWorkspace Intelligenceのような、「あなたをよく知っているAI」の側面だ。XRメガネのデモを思い出してほしい。Geminiは「先週、友人のGiannaと会った場所まで案内して」というひとことから、Googleフォトとカレンダーをたどって場所を割り出し、ついでに「いつものコーヒー」まで覚えていた。固有名詞や状況をいちいち説明しなくても、Geminiが理解して賢く対応してくれる。この使い心地のよさは、Gmailや写真、カレンダーといったあなたの日常データを、すでにGoogleが預かっていることから生まれている。外から接続する形のAIだと、同じ使い心地はなかなか出せない。

AIアシスタントとして、いまもChatGPTを質問の相手に使っている読者は多いだろう。それは引き続き使い続けて構わない。ただ、AIはもう質問に答えるだけの存在ではなくなりつつある。OpenAIのCodexにせよ、本稿で見てきたGeminiの新機能にせよ、AIに作業を任せる時代がいよいよ生活と仕事の中に入ってきた。本稿をきっかけに、Geminiにも少しずつ触れてみてはいかがだろうか。日常の景色が、これまでとは違って見えてくるはずだ。

AIエージェント時代の全貌
AIエージェント時代の全貌を一枚にまとめたインフォグラフィック。基調講演と関連対談動画を素材にNotebookLMを使用して生成。


Google I/Oの基調講演の後、会場で行われたいくつかの対談の様子が公式YouTubeページで公開されていた。基調講演とこれらの動画をもとに、NotebookLMを使ってインフォグラフィック化してみた。

あなたに代わってAIエージェントがさまざまな仕事をする時代が本格的に始まっている。これからのAIエージェントは24時間365日休まず働くことができる。AIの知能が人類を超える日「AGI」が近いと言われている。そして、AIエージェントはコンピュータや画面の中から飛び出し、ロボットとしても活躍する時代が来るだろう。科学の分野でもAIが活躍し、大きく私たちの未来を変えていきそうである。

テクニカルライター 鈴木 啓一


AI活用術 - ITライフハック

ITライフハック
ITライフハック X(旧Twitter)
ITライフハック Facebook
ITライフハック YouTube

ITビジネスに関連した記事を読む
説明はAIにまかせる時代へ!「聞きパ」で変わるビジネスの新常識とTALKsmithの挑戦
建設・工事業の工事管理システム導入が1年で300%増、中小企業が現場DX投資を加速
需要×申込スピードで「激戦区」を可視化!イタンジ、東京・大阪「激戦区ランキング2026」を公開
パーパス経営とAI活用で企業変革を推進!ファインズ土屋政紀氏が語る「ブランドを創る経営改革」
ホンダ新型EV「Super-ONE」披露!若槻千夏、20年のキャリアで辿り着いた“地蔵スタイル”のワイプ進化を熱弁

最速でわかる生成AI実践ガイド
山田 博啓
技術評論社
2026-03-12





関連記事

コメントは利用できません。

カテゴリー

アーカイブ

ページ上部へ戻る