はじめに
2025年6月に開催された「AWS Summit Japan 2025」にて、Amazonが開発する新しい基盤モデルファミリー「Amazon Nova」が紹介され、参加者の関心を集めました。本記事では、Summitで公開された情報に基づき、Amazon Novaの概要、各モデルの特長、そして具体的な活用事例について解説します。
1. Amazon Novaとは
Amazon Novaは、Amazon Bedrockを通じて提供される、新しい基盤モデル(Foundation Model)です。主な特徴は、先進的な性能と優れたコストパフォーマンスを両立し、多様なビジネス要件に応じて最適なモデルを選択できる点にあります。そして最も重要視されている特徴として、「責任あるAI」が挙げられています。
Amazon Novaファミリーは、以下の3つのカテゴリに分類される合計7つのモデルで構成されています。
- マルチモーダル理解モデル
Amazon Nova Micro
Amazon Nova Lite
Amazon Nova Pro
Amazon Nova Premier
- クリエイティブコンテンツ生成モデル
Amazon Nova Canvas
(画像生成・編集)Amazon Nova Reel
(動画生成)
- 音声対話モデル
Amazon Nova Sonic
シンプルなテキスト処理から複雑なマルチモーダル処理まで、求められる性能とコストに応じてモデルを選択できるアーキテクチャは、多くの企業にとって導入のハードルを下げるものとなるでしょう。
2. モデル選定のポイント
Amazon Nova マルチモーダル理解モデル
Amazon Nova Micro | Amazon Nova Lite | Amazon Nova Pro | Amazon Nova Premier | |
---|---|---|---|---|
提供状況 | 一般提供中 | 一般提供中 | 一般提供中 | 一般提供中 |
コンテキスト長 | 128K | 300K | 300K (5M まもなく登場) |
1M |
対応言語数 | 200 以上 | 200 以上 | 200 以上 | 200 以上 |
対応入出力 | 入力: テキスト 出力: テキスト |
入力: テキスト・画像・動画 出力: テキスト |
入力: テキスト・画像・動画 出力: テキスト |
入力: テキスト・画像・動画 出力: テキスト |
ファインチューニング | 対応 | 対応 | 対応 | 非対応 |
Amazon Novaファミリーの中から最適なモデルを選ぶ際には以下の観点がポイントとなります。
1. 用途(ユースケース)に合わせて選ぶ
- テキスト処理中心:チャットボット、FAQ、要約、分類など → Micro / Lite
- 画像・動画も扱いたい:画像や動画の内容理解、データ抽出、アーキテクチャ図の解析など → Lite / Pro / Premier
- 高精度な推論や大規模データ処理:複雑な分析や高度な推論が必要な場合 → Premier
2. 性能(コンテキスト長・対応データ)で選ぶ
- コンテキスト長
- 長い文書や大量データを一度に処理したい場合は、Premier(1M)やPro(300K/5M)が有利
- 短いテキストや小規模データならMicro(128K)やLite(300K)で十分
- 対応データ種別
- Micro:テキストのみ
- Lite/Pro/Premier:テキスト+画像+動画
3. コストパフォーマンスで選ぶ
- コスト重視:日常的な業務や大量処理にはMicro / Liteが最適
- バランス重視:性能とコストのバランスを取りたい場合はPro
- 最高性能重視:コストよりも精度や処理能力を優先する場合はPremier
4. カスタマイズ性(ファインチューニング・蒸留)
- 自社業務に特化したモデルが必要:Micro / Lite / Proはファインチューニング対応
- Premierはファインチューニング非対応だが、モデル蒸留で小規模モデルに知識を継承可能
これらの観点と上記の表を参照して最適なモデル選択を行うことができます。さらに、Amazon Novaはコスト面でも大きな優位性を持っています。以下の表は各モデルの1000トークンあたりの価格と競合他社との比較イメージです。
モデル名 | 入力料金 | 出力料金 | キャッシュ読取料金 | バッチ入力料金 | バッチ出力料金 |
---|---|---|---|---|---|
Amazon Nova Micro | $0.000042 | $0.000168 | $0.0000105 | $0.000021 | $0.000084 |
Amazon Nova Lite | $0.000072 | $0.000288 | $0.000018 | $0.000036 | $0.000144 |
Amazon Nova Pro | $0.00096 | $0.00384 | $0.00024 | $0.00048 | $0.00192 |
Claude Sonnet 4 | $0.003 | $0.015 | $0.0003 | N/A | N/A |
Claude 3 Haiku | $0.00025 | $0.00125 | 該当なし | $0.000125 | $0.000625 |
GPT-4.1 | $0.002 | $0.008 | $0.0005 | N/A | N/A |
※GPT-4.1以外は東京リージョン
3. クリエイティブ業務を支援する「Amazon Nova Canvas/Reel」
Amazon Nova Canvasはテキストや画像を入力として、高品質な画像を生成・編集するクリエイティブコンテンツ生成モデルです。
主な機能
- アウトペインティング
自然言語による指示で製品画像といったターゲットの背景を生成することができます。上図にあるように、背景についても細かく指示することが可能です。
プロンプトなしで高精度な背景除去が可能です。ECサイトの商品画像作成やプレゼンテーション資料の作成時間を短縮できます。機能として提供しているためユーザー側で追加のファインチューニングや設定を行う必要がない点が特徴です。
Amazon Nova Reelは、自然言語プロンプトや画像入力から、誰でも簡単に動画を生成できるクリエイティブコンテンツ生成モデルです。従来の動画編集のような複雑な操作は不要で、直感的な指示だけで高品質な動画を作成できます。
主な特徴
-
自然言語プロンプト・画像入力対応
例:「砂浜に置かれた大きな貝殻のクローズアップ、貝殻の周りを穏やかな波が流れる。カメラがズームイン」
このような日本語や英語の文章、または画像を入力するだけで、イメージ通りの動画が生成されます。 -
ストーリーボード形式で最大120秒まで出力可能(Amazon Nova Reel 1.1から)
複数のシーンを組み合わせて、最大2分間の動画を作成できます。 -
カメラワークの細かな指示が可能
「カメラがズームイン」「パンする」「トラッキングショット」など、カメラの動きも自然言語で指定できます。 -
責任あるAI設計
Amazon Nova Reelは、倫理的なガイドラインに基づき、責任あるAIとして設計・運用されています。
実際のプロンプト例
例えば、以下のようなプロンプトを入力します。
Closeup of a large seashell in the sand, gentle waves flow around the shell. Camera zoom in.
日本語訳:
「砂浜に置かれた大きな貝殻のクローズアップ、貝殻の周りを穏やかな波が流れる。カメラがズームイン」
このプロンプトを入力するだけで、
- 砂浜に大きな貝殻が置かれている
- 貝殻の周りを穏やかな波が流れている
- カメラが徐々に貝殻にズームインしていく
といった映像が生成されます。
実際の生成例はこちらです:
4. 音声対話AIを革新するAmazon Nova Sonicの特長と拡張性
Amazon Nova Sonicは、リアルタイムでスムーズな音声対話を実現するモデルです。単なる音声アシスタントに留まらない、高度な機能が実装されています。
- 流動的な対話:ユーザーの一時停止、躊躇、割り込みに対しても自然な会話の流れが可能
- リアルタイムストリーミング:Amazon Bedrockの双方向ストリーミングAPIを通じてアクセス
- 外部機能をツールとして呼び出し: 外部サービスとの相互作用を実現できる。RAG(Retrieval Augmented Generation = 検索拡張生成)を使用して企業データによる知識の根拠付けも可能
- 責任あるAI:有害な出力を制御したり、人間に認知できない信号で後からAmazon Nova Sonicが出力したものか判別可能
外部ツール連携とRAGによる拡張性
Amazon Nova Sonicの強みの一つは、外部APIとの連携機能です。例えば、顧客からの「注文状況を教えて」という音声問い合わせに対し、Amazon Nova Sonicが社内の注文管理システムのAPIを呼び出し、取得した情報を基に音声で回答するといったAIエージェントの構築が可能です。
この機能は、社内ナレッジベースと連携するRAG (Retrieval Augmented Generation: 検索拡張生成)との親和性も高く、コンタクトセンターの高度化や、専門的な知識を持つ社内向けアシスタントの実現に大きく貢献することが期待されます。
5. 公開された活用事例
講演では、すでにAmazon Novaが活用されている具体的な事例も紹介されました。
- 開発支援: AWSのサポートエンジニアが、顧客から提供された複雑なアーキテクチャ図をAmazon Novaに解釈させ、問題解決のヒントを得たり、検証用のインフラコード(CDK/CloudFormation)を生成させたりする活用が進んでいます。
©2025, Amazon Web Services, Inc. or its affiliates. All rights reserved.
- コンテンツ制作の自動化: Prime Videoのドラマシリーズ全話(約450分)をAmazon Novaに読み込ませ、あらすじのナレーション生成から映像編集までを自動で行い、3分間の総集編動画を制作した事例が紹介されました。
6. ビジネス利用における「責任あるAI」への取り組み
これまで各モデルの機能に触れてきましたが、Amazon Novaファミリー全体で一貫して重要視されている特徴が「責任あるAI」です。
生成AIをビジネスで安全に活用するには、著作権やコンプライアンス、ブランド保護といったリスクへの対応が不可欠です。Amazon Novaは、企業の業務やサービスに深く組み込まれることを想定し、以下のような具体的な仕組みでこれらの課題に応えています。
- 著作権補償: AWSは、顧客が一般的に利用可能なAmazon Novaモデルによって生成された出力に起因して第三者から知的財産権の侵害を主張された場合、上限のない知的財産 (IP) 補償を提供します。これにより、万が一の際のリスクを低減できます。(詳細は公式ドキュメントを参照)。
- ウォーターマーク: Amazon Nova CanvasやAmazon Nova Reelが生成した画像・動画には、人間には知覚できない電子透かしが埋め込まれます。これにより、AIによる生成物であることを識別可能にし、透明性を確保します。Amazon Nova Sonicにも同様の仕組みが備わっています。
これらの取り組みは、コンプライアンスやブランド保護の観点から、ビジネス利用における重要な要素となります。
まとめ
AWS Summit Japan 2025で解説されたAmazon Novaは、単なる生成AIプラットフォームではなく、多様なビジネス要件に応える柔軟性、コスト効率、そしてエンタープライズ利用を前提とした信頼性を兼ね備えた、戦略的なプラットフォームとして位置づけられています。
特に、AIエージェントへの応用を意識したアーキテクチャと、「責任あるAI」への具体的なコミットメントは、今後多くの企業で生成AIの導入を後押しする要素となるでしょう。
Amazon Novaは、すでにAmazon Bedrock Playgroundで利用可能です。ご興味のある方は、ぜひその実力に触れてみてはいかがでしょうか。