Amazon の新AI『NOVA Act』が描く未来
「ああ、誰か代わりにやってくれたら…」
そんな願い、ありませんか?
朝から晩まで、仕事に家事に予定の管理。
パソコンの前に座って、ブラウザを何十個も開いて情報を集め、予約フォームに入力して、資料をまとめて…。
ふと時計を見れば、何時間も経っているのに、本当にやりたかったことにはまだ手をつけられていない。
そんな経験、きっと誰もが一度はあるはずです。
「誰か代わりに全部やってくれたらいいのに」――この思いを、本気で叶えようとしているのが、Amazon の新しいAIエージェント『Nova Act(ノヴァ・アクト)』です。
自分の手のように、AIが Web を操作する時代へ
Nova Act は、これまでのAIとは明らかに違います。
多くの人が思い浮かべるAIと言えば、質問に答えたり、予定を読み上げたりする”おしゃべりな相棒”のような存在でしょう。
しかし、Nova Act は「話す」AIではなく「動く」AIです。
このAIは、あなたが指示を出せば、自ら Web ブラウザを操作して必要な情報を探し、画面をスクロールし、リンクをクリックし、フォームに必要事項を入力してくれるのです。
まるで、画面の向こうにもう一人の”自分”が現れて、黙々と作業を進めてくれるような感覚です。
例えば、Sweetgreen から食事を注文したり、レストランの予約をしたりといった基本的なタスクを自動化できます。
Nova Act SDK を使えば、開発者はAIエージェントがウェブページをナビゲートし、フォームに入力し、カレンダーから日付を選択するなどのツールを組み合わせることができます。
Nova Act の背後にあるのは、Amazon のAI戦略の核心
この革新的なAIを生み出したのは、Amazon の最近サンフランシスコに開設した「AGI(汎用人工知能)ラボ」です。
元 OpenAI の研究者である David Luan と Pieter Abbeel が共同リーダーを務めるイニシアチブです。
二人とも以前は自身のスタートアップを設立していました—Luan は Adept を、Abbeel は Covariant を共同設立—その後、昨年 Amazon がAIエージェント開発を主導するために彼らを引き抜きました。
Nova Act は研究プレビュー版として公開されており、開発者は新しいウェブサイト「nova.amazon.com」を通じて Nova Act ツールキットにアクセスできます。
このサイトはまた、Amazon のさまざまな Nova 基盤モデルのショーケースとしても機能しています。
Amazon によれば、Nova Act は ScreenSpot Web Text などの同社の内部テストで OpenAI や Anthropic のエージェントよりも優れたパフォーマンスを発揮したとのことです。
例えば、AIエージェントが画面上のテキストとどのように相互作用するかを測定する ScreenSpot Web Text では、Nova Act は 94% のスコアを獲得し、OpenAI の CUA(88%)や Anthropic の Claude 3.7 Sonnet(90%)を上回りました。
未来は企業だけのものではない――私たちの生活にも広がる可能性
ここまで読んで「すごい技術だけど、企業向けでしょ? 私たち一般人には関係ないよね」と感じた方もいるかもしれません。
けれど、ちょっと想像してみてください。
忙しい朝、あなたが朝食を作っている間に、Nova Act がネットでレストランの予約をしてくれていたら?
あるいは、煩雑なフォーム入力を、あなたの代わりにウェブサイトにログインして情報を入力してくれたら?
カレンダーから日付を選んでくれる。
しかもすべて、あなたが「これお願い」と伝えるだけで。
さらに、Nova Act は今後リリース予定の Amazon の人気音声アシスタントの生成AI強化版である「Alexa+」の主要機能にも組み込まれる予定です。
Amazon は他社に先駆けてこの技術を開発したわけではありませんが、Alexa+ を通じて最も広いリーチを持つ可能性があります。
人間の”脳”から”手足”へ――AIの進化がもたらす変化
これまでのAIは、私たちの”頭脳の一部”を代替してきました。
記憶を助け、調べ物をし、判断を支援する存在。
でも、Nova Act はそこからさらに一歩進んで“行動する存在”としてのAIを目指しています。
Luan は、AGI ラボがサラダを注文できるAIエージェントを構築していることは奇妙に思えるかもしれませんが、エージェントは超知能AIシステムの作成に向けた重要なステップだと考えています。
Luan は AGI を「コンピュータ上で人間ができることなら何でも支援できるAIシステム」と定義しています。
Nova Act SDK は短くシンプルなタスクを確実に自動化し、開発者にエージェントのワークフローにおいて人間の介入を必要とするタイミングを正確に定義するツールを提供するよう設計されています。
これにより、完全に自律的ではないにせよ、より信頼性の高いエージェントアプリケーションの作成が可能になると期待されています。
まとめ:AIが動き出す時代、私たちは何をするのか
技術の進歩は、ときに私たちを驚かせ、不安にもさせます。
けれど思い出してください。かつてスマートフォンが登場したときも、インターネットが家庭に入ってきたときも、最初は「よく分からないもの」だったはず。
でも今では、それなしの生活なんて考えられません。
Amazon の Nova Act も、やがてそんな存在になるでしょう。
AIが”話す”から”動く”へ。
これからのAIは、ただのツールではなく、あなたの分身となって Web の世界を歩き出します。
OpenAI、Google、Anthropic の初期のAIエージェントには、さまざまな領域での信頼性に大きな問題がありました。
TechCrunch のテストによれば、これらのシステムは遅く、長時間独立して動作することが難しく、人間なら犯さないようなミスを起こしがちです。
Amazon がこの問題を解決したのか、それとも同じ欠陥に悩まされるのかは、すぐに明らかになるでしょう。
Nova Act という新しい一歩は、その未来への入り口。
あなたのもう一人の自分が、静かにブラウザの向こうで動き始めるその瞬間は、すぐそこまで来ています。
参考:Amazon unveils Nova Act, an AI agent that can control a web browser
コメント