AMAZON でお買物

AIがついにブラウザを操り始める—Amazon Nova Act が描く未来は『インターネットの第二の黄金時代

AI

あなたが最後にインターネットで「ときめいた」のは、いつですか?

パソコンを開いた瞬間、見知らぬ世界が目の前に広がる—そんな高揚感を、最後に味わったのはいつだったでしょうか。

かつてのインターネットは、まるで広大な図書館に迷い込んだような世界でした。
知らない言葉を検索し、関連ページを次々と渡り歩くうちに、自分の中に新しい知識や興味が育っていく。
ブログや掲示板では、人の言葉が生きていて、画面越しにも温度が伝わってきたものです。

でも今のネットはどうでしょう。
検索をしても、表示されるのは広告や似たようなまとめページばかり。
AIが返してくる答えも整ってはいるけれど、どこか一方通行で、そこに「発見」や「探求」の面白さは感じにくくなってきている気がします。

そんな中、Amazon が発表したのが「Nova Act」と呼ばれる新しいAI技術です。
これはただの便利ツールではありません。
人と共に考え、行動し、インターネットを再び”冒険の場”に変えてくれるAIエージェント。
静かに、しかし確かな希望を携えて登場したこの技術に、今、大きな注目が集まっています。

Nova Act とは何者か?——”考えて、動く”AIエージェントの誕生

Nova Act の最大の特徴は、ウェブブラウザ内でタスクを実行できる高度なAIモデルという点です。
これは単に「ネット上の情報を使う」という意味ではありません。

従来のAIは、過去に学習した情報を引き出して応える”記憶型”の存在でした。
ユーザーが問いかけたら、そのデータベースの中から最も適切な答えを返す。
それは効率的だけれど、あくまで「受け身」の機械だったのです。

しかし Nova Act は、ウェブブラウザを通じて自らタスクを実行し、その場で情報を収集・分析し、行動を選びます。
つまり、今この瞬間のウェブ世界を”読み取りながら動く”、まるで探検家のようなAIなのです。

あなたが「旅行を計画したい」と言えば、Nova Act は各航空会社やホテルサイト、口コミ情報をその場で比較し、最適なプランを導き出すでしょう。
しかも、天気予報や現地のイベント情報なども考慮して提案してくれるかもしれません。
それはもう、AIがただ答えを出すだけでなく「あなたの一歩先」を読み取って行動するパートナーであると言えるのです。

透明なAIへ——「ブラックボックス」からの脱却

もうひとつ、Nova Act が従来のAIと大きく異なる点があります。
それは「中身が見える」ことです。

これまでの多くのAIは、どんなデータで学習しているのか、どんなロジックで答えを出しているのかがわからない”ブラックボックス”型でした。
ユーザーにとっては、それが正しいのかどうか、偏っていないのかを判断する手段がなかったのです。

Nova Act は、この構造を根本から変えようとしています。
AIがなぜその答えに至ったのか、どの情報を参照したのかをユーザーが理解できるように設計されているのです。
これは、AIを”使うもの”から”対話する相手”へと進化させる、大きな一歩と言えるでしょう。

このような透明性は、教育、医療、行政など、信頼が重要な分野でのAI活用においても、非常に価値あるものとなるはずです。

なぜ Amazon が、今この技術を開発するのか

では、なぜ Amazon がこうした革新的なAI技術を開発しているのでしょうか。

その背景には、現代のAIが抱える構造的な課題があります。
Amazon によれば、現在のAIエージェントは単なる質問応答や情報検索を行うだけでなく「結婚式の手配」や「複雑なITタスクの処理」といった、多段階の複雑なタスクを実行できるエンティティとして定義されるべきだと考えています。

また、現在の市場で提供されているエージェントの多くは、継続的な人間の監督を必要とし、その機能性は包括的な API 統合に依存していますが、これはすべてのタスクに対して実現可能とは言えません。
こうした制約を超え、もっと自由に、もっと人間らしいインターネットとの関わり方を可能にする存在—それが Nova Act の目指す姿なのです。

Amazon はこの分野において、AIを単なる効率化の道具としてではなく、人の思考や探求を支える”知的パートナー”へと進化させたいと考えているのかもしれません。

Nova Act がもたらす、ちょっと先の未来の暮らし

もし Nova Act が本格的に私たちの生活に浸透したら、どんな変化が起こるでしょうか。

Amazon は、モデルと共に「Amazon Nova Act SDK」の研究プレビューもリリースしています。
この SDK を使用することで、開発者はウェブ上での不在通知の送信、カレンダーの予約、自動メール返信などのタスクを自動化できるエージェントを作成できます。

SDK は、検索、チェックアウト、ドロップダウンやポップアップなどの特定のインターフェース要素との対話など、複雑なワークフローを確実な「アトミックコマンド」に分解することを目指しています。
例えば、チェックアウト中に保険のアップセルをバイパスするようにエージェントに指示することができます。

つまり、Nova Act は単なる効率の向上ではなく「考える楽しさ」「調べる面白さ」「納得する気持ち」を私たちにもう一度取り戻させてくれるのです。

AIと”並んで歩く”未来へ

Nova Act の技術は、まだ始まったばかりです。
すぐにすべてが実現するわけではありません。
しかし、そのベンチマーク結果は非常に印象的です。

Nova Act は、テキストベースの対話を測定する ScreenSpot Web Text ベンチマークで 0.939 という高いスコアを達成し、Claude 3.7 Sonnet(0.900)や OpenAIのCUA(0.883)などの競合モデルを大幅に上回っています。

また、最小限の追加トレーニングで新しい環境に対応できる能力も Nova Act の特筆すべき機能の一つです。
Amazon によれば、Nova Act はトレーニングにビデオゲームの経験が含まれていなかったにもかかわらず、ブラウザベースのゲームでも見事に機能しました。

AIにすべてを任せてしまう未来ではなく、AIと共に悩み、学び、選んでいく未来。
その第一歩として、Nova Act はとても静かに、けれども確かに、私たちの前に現れました。

あの頃のように、もう一度インターネットでわくわくしたい。
そう願うすべての人にとって、Nova Act は新しい希望の象徴になるかもしれません。

参考:Amazon Nova Act: A step towards smarter, web-native AI agents

コメント

タイトルとURLをコピーしました