この記事について
この記事は、Data + AI Summit 2025 で発表された “Introducing Agent Bricks: Auto-Optimized Agents Using Your Data” について、日本語でまとめた記事となります。Agent Bricksは企業が独自データを活用した高品質なドメイン特化型AIエージェントを簡単に構築できる画期的な技術となっています。
この記事はDatabricksの公式ブログ記事を元にした非公式の日本語要約であり、すべての著作権・知的財産権はDatabricksに帰属します。
目次
- はじめに
- Agent Bricksの主な特徴
- 現在のエージェント開発が抱える課題
- Agent Bricks:ドメインタスクのための自動最適化エージェント
- Agent Bricksで高品質なエージェントを構築
- 技術を支える最新研究:ALHF
- 研究から本番導入までのスピード
- まとめ
1. はじめに
企業が独自データを活用したAIエージェントを本番環境に展開するとき、多くの課題に直面します。高品質なエージェントを効率的に構築することは依然として複雑なままです。本記事では、Databricksが新たに発表したAgent Bricksを紹介します。「Agent Bricks」はタスクの内容を伝えるだけで、評価や最適化を自動的に処理が可能かつノーコードでも構築が可能なため、ドメイン特化のAIエージェントを簡単かつ迅速に構築可能です。
2. Agent Bricksの主な特徴
- 自動最適化されたエージェント: タスクを説明するだけで、ドメイン固有の高品質エージェントを構築可能。Agent Bricksが評価とチューニングを処理します。
- 高速かつコスト効率の高い結果: Mosaic AI研究による自動最適化で、より低コストで高品質なAIを実現。
- 本番環境での実績: Flo Health、AstraZeneca、Experianなど多くの企業が数週間ではなく数日でAIを安全かつ正確に導入しています。
3. 現在のエージェント開発が抱える課題
昨年、Mosaic AIプラットフォームの登場により、データインテリジェンス(データに基づいて推論できるAI)の構築が可能になりました。多くの企業が独自データを活用したドメイン固有のエージェントを本番環境に導入しています。
しかし、高品質なエージェントの構築には依然として以下の課題があります:
項目 | 説明 |
---|---|
評価の難しさ | LLMや人手による判断が難しく、実運用に即した評価基準が不足。詳細な評価には手動のラベリングが必要となり、コストが高い。 |
パラメータが多すぎる | プロンプト、インデックス分割、モデル選定、ファインチューニングなど、調整項目が多く手間がかかる。 |
コストと品質 | 高品質なエージェントの構築後も運用コストが高くなる傾向があり、費用対効果の面から品質維持が難しい。 |
4. Agent Bricks:ドメインタスクのための自動最適化エージェント
Agent Bricksは前項で述べたエージェント開発の複雑さを抽象化し、開発者はエージェントの目的を自然言語で定義するだけで、評価・チューニングが自動で実行されます。またエージェントの品質向上のためにバックグラウンドでメソッドとハイパーパラメータースイープが実行されるため、モデルの結果を継続的に最適化することが可能です。
Agent Bricksの動作プロセス
-
タスクの宣言
タスクを選択し、自然言語でエージェントの目的を定義し、データソースを接続します。 -
自動評価
Agent Bricksは、合成データの生成やカスタムLLMジャッジの構築などを通じて、タスク固有の評価ベンチマークを自動的に作成します。 -
自動最適化
Agent Bricksは、プロンプトエンジニアリング、モデルのファインチューニング、報酬モデル、テスト適応型最適化(TAO)など、様々な最適化テクニックを組み合わせ、高品質を実現します。 -
コストと品質
Agent Bricksは、エージェントが効果的であるだけでなく、コスト効率も高いことを保証します。ユーザーはコスト最適化またはパフォーマンス最適化モデルを選択できます。
Agent Bricksは、構造化情報抽出、信頼性の高い知識支援、カスタムテキスト変換、複数エージェントのオーケストレーションなど、一般的な業界ユースケースに最適化されています。
5. Agent Bricksで高品質なエージェントを構築
Agent Bricksは品質を測定、構築、継続的に改善する能力を持ちます。例えば、文書に関する対話型エージェント構築において、複数のQ&Aベンチマークで品質を測定したところ、この分野の他の製品と比較して、Agent Bricksは大幅に高品質なエージェントを構築しました。また、継続的学習機能により、時間とともにパフォーマンスが向上し続けます。
文書理解においては、Agent Bricksはプロンプト最適化された専用LLMと比較して、より高品質で低コストのシステムを構築します。文書解析ベンチマークでより高品質でありながら、最大10倍低コストのシステムを実現できます。
6. 技術を支える最新研究:ALHF
Agent Bricksの高い成果を支えているのは、Databricks Mosaic AI Researchチームによる研究成果ですが、その中でも特に重要なアプローチである「Agent Learning from Human Feedback(ALHF)」を紹介します。
Agent Learning from Human Feedback (ALHF)
ALHFは、「フィードバックをどう活かすか」という難題に正面から取り組んでいます。というのも、フィードバックは多くの場合「良い/悪い」といったざっくりした内容にとどまり、どのコンポーネントをどう改善すればよいのかが見えにくいのが現状です。また、すべての指示を1つの巨大なプロンプトに詰め込む従来の方法では、複雑なエージェントシステムには限界があります。
ALHFでは、次の2つのアプローチでこれを解決します:
- 「1990年5月以前のデータは使わないで」といった具体的な自然言語の指示を、文脈を踏まえて理解する能力。
- その指示をもとに、検索アルゴリズムのチューニング、プロンプトの改良、ベクトルDBのフィルタ適用、さらにはエージェント構成自体の見直しなど、技術的な最適化へと自動でつなげる能力。
この仕組みによって、エンジニアでなくても、ドメイン知識を持つ専門家がシステム改善に直接貢献できるようになります。
7. 研究から本番導入までのスピード
すでにAgent Bricksを導入している企業では、開発スピードが大きく向上しています。たとえば以前は数週間かかっていたエージェント開発がたった1日で完了したケースもあります。また、パフォーマンスが2倍にアップしたという事例もあり、ほんの数ヶ月前には不可能と思われていた「持続可能かつ拡張性のあるAIシステム」が、今では安定してビジネス価値を生み出しています。
8. まとめ
Agent Bricksは、「デモは動くけど本番には耐えられない」というAI開発にありがちなギャップを埋めてくれるツールです。
特に、こんな悩みを抱える開発者や企業にピッタリです:
- 高品質なドメイン固有AIエージェントを効率的に構築したい
- 評価とチューニングに多くの時間を費やしている
- コストと品質のバランスに苦労している
- 非技術者のドメインエキスパートのフィードバックを効果的に取り入れたい
現在、Agent Bricksはベータ版として提供中です。詳細についてはDatabricksの公式ドキュメントをご確認ください。
ナレッジコミュニケーションでは、Databricks Data + AI Summit 2025 開催にあわせてセッションレポートや、イベント情報を公開しております!
ぜひナレッジコミュニケーションDAIS2025 特設サイトからチェックしてみてください!