Amazon Nova 2でAIはどう変わる? 「考えて動く」が当たり前になる社会へ

1. はじめに

この記事は株式会社ナレッジコミュニケーションが運営する チャットボット と AIエージェント Advent Calendar 2025 の23日目にあたる記事になります!

ナレッジコミュニケーションでは最新の生成AI技術を活用した業務効率化や、AIエージェントの導入支援を行っています。2025年、生成AIを取り巻く環境は「知能の高さ」を競うフェーズから、いかに実業務を「実行」させるかというフェーズへと大きな転換点を迎えています。

image.png

今回はAWS re:Invent 2025で発表され、現在大きな注目を集めているAmazon Nova 2ファミリーを軸に生成AIの課題について考察します。


2. 生成AIが直面する「実行の壁」

これまで業界を牽引してきたのは、GoogleのGeminiやOpenAIのGPTシリーズに代表される「どれだけ高度な推論ができるか」という知能性能の競争でした。しかし、これらを実際の業務プロセスに組み込もうとすると多くの企業が共通の壁に突き当たります。

ここで立ちはだかるのが、いわば「実行の壁」です。
AIは確かに賢くなりました。しかし、既存の社内システムを操作して業務を最初から最後までやり切るところまでは、まだ人の手を離れていません。この「示唆は得られるが、実作業は人が行う必要がある」というギャップこそが、生成AIの社会実装を難しくしてきた最大の要因です。

この課題に対し、AWSが発表した Amazon Nova 2ファミリーは「生成AIをどう動かすか」という観点で非常に実務寄りの解答を提示しています。


3. 対照的な2つの戦略:知能の最大化 vs 実行力の提供

image.png
https://www.youtube.com/watch?v=-nMiqOgQbHc

今回のre:inventにてAmazon Novaの詳細が発表された場面

Googleの戦略:「知能」を極限まで高める

以下のGoogle公式の最新ブログでは、一貫して知能性能の最大化に軸足を置いています。ネイティブマルチモーダルな設計思想に基づくGeminiはテキスト、画像、音声、動画、さらには大量のドキュメントを横断的に理解し、高度な推論を行う能力において高い評価を得ています。研究開発や分析、クリエイティブな意思決定支援といった深い洞察が求められる領域では、こうした「知能」を高めることが大きな優位性となります。

ネイティブマルチモーダルな設計と、高度な推論(Reasoning)能力の向上について言及されています。

AWSの戦略:「実行」のための生成AI基盤

一方、今回のre:Inventでの発表でAWSはAmazon Novaを通じて、生成AIに知能だけでなく、業務を完遂するための具体的な「実行手段」を与えることに注力しています。
Amazon Nova 2は、用途に応じて最適化された4つのモデル(Lite, Pro, Omni, Sonic)で構成されています。
この設計思想の最大の特徴は、「AIにいかに高度な思考をさせるか」だけでなくコストや速度、メディア形式の制約がある実務現場において「どのモデルに、どの役割を任せるか」というオーケストレーションを前提としている点にあります。

API のないシステムをブラウザ操作で自動化する「実行」のためのエージェント機能についての公式解説です。


4. 実務を加速させるNova 2のコア機能

Nova 2ファミリーの大きな特徴の一つは、シリーズ全体で最大100万トークンのコンテキストウィンドウをサポートしている点です。これにより、長大なドキュメントや複雑なコードベースや長時間の対話履歴を一度に読み込ませた上での推論・実行が可能になり、実務における「文脈の欠落」という課題を解消しています。

Nova Act:既存システム操作の現実解

企業の業務自動化において最大の障壁となるのが、APIの存在しないレガシーシステムです。
Nova Act(プレビュー)が取っているアプローチは、APIを前提にせず、ブラウザ上のUI操作そのものをAIに実行させるというものです。人が行っていた申請処理やデータ入力を、ブラウザ操作のワークフローとして再現することを目指しています。

公式発表では、ブラウザUIの自動化において高い信頼性が示されていますが、これは「全ての業務を魔法のように自動化する」ものではなく、あくまで現場の制約を受け入れた上での高度な自動化機能です。この現実的なアプローチこそが、Nova Actの真の価値と言えます。

Nova 2 Sonic:業務レベルの低遅延・音声対話

業務における実行力は、操作能力だけでなく反応速度にも左右されます。
Nova 2 Sonicは音声入力と音声生成を統合した、極めて低遅延なリアルタイム対話向けモデルです。コールセンターや受付、医療・介護の現場など一瞬の「間」が体験品質を左右する領域での活用が想定されています。100万トークンのコンテキスト維持能力と組み合わせることで、過去の経緯を正確に踏まえたカスタマー対応が可能になります。


5. エージェント・エンジニアリングという新しい設計軸

image.png
Nova 2の登場は、開発者に求められる役割の変化も示しています。

これまで重視されてきたのは、いかに良い回答を引き出すかというプロンプトエンジニアリングでした。しかし今後は、複数のAIモデルを役割ごとに組み合わせ、業務フローとして成立させる「設計力」が重要になります。

たとえば、音声(Sonic)で受け付けた要望をもとに、マルチモーダルモデル(Omni)で内容を整理し、必要な手順を計画。最後にNova Actで実際のシステム操作を行う。この一連の流れをAWS Step Functionsなどの既存インフラと組み合わせて制御することで、AIは単なるチャットボットではなく、デジタルな実務担当者として振る舞うようになります。


6. おわりに:AIエージェントと共に歩む新しい業務のカタチ

Amazon Nova 2ファミリーの登場に象徴されるように、2025年は生成AIが「知能」から「実行力」へと移行する年だと言えるでしょう。しかし、強力なモデルや機能が揃っただけで業務が自動化されるわけではありません。

真に価値を生むのは、AIが単なる「便利な道具」を越え、明確な役割と目的を持って自律的に動く「AIエージェント」として組織に組み込まれたときです。

これからのビジネスシーンでは、「AIに何をさせるか」という業務の再定義と、複数のエージェントが協調して動くための高度な設計力が、企業の競争力を左右することになります。

私たちナレッジコミュニケーションは、最新の技術動向をいち早く捉え、単なる導入支援に留まらず、お客様の業務プロセスを深く理解した上で「実行し、結果を出すAIエージェント」の実装をトータルにサポートしていきます。

この記事を書いた人

aws-recipe-user