データ分析プロジェクトで考えておきたいポイント ① ツール選定の指針

はじめに

データ分析プロジェクトを進めていくうえでまず考えたいことを整理します。
ビジネスドメインのメンバーにも伝わるよう、できるだけ技術用語は使わないよう留意しました。

やっぱり銀の弾丸はない

最初から身もふたもないですが、やっぱり銀の弾丸(=これをやれば万事解決する)はありません。
AI モデルはあくまで「ツール」であり、「目的」を設定して価値を見出すのは「ユーザー」です。
とはいえある程度は指針が欲しいので、まずはここを抑えるべきというポイントを2点あげます。

ツール選定の指針

AI 関連ツールはざっくりと以下3種に大別できます。

  • 特化アプリケーション組み込み型
    • 特定の目的のために開発されたAIを搭載したアプリケーション
    • デファクトスタンダードになっているアプリは除く
      • 利用者が段違いに多くどんどん平準化/最適化されていく
      • ex. Office365、Google Workspace
  • API 連携型
    • いわゆる「マネージドAI」と呼ばれるクラウド型のサービス
    • API で連携してモデルの結果を取得
    • 従量課金型が多い
    • 自社で管理しているアプリケーションがある場合、すぐに組み込み可能
  • 自社開発
    • データ分析基盤を利用し自社でモデルを開発
    • プラットフォームによっては従量課金型
    • 各社基盤を用意していて、データ回りのサービスとの連携に優れる

それぞれのツールにメリット/デメリットがあります。
要件定義の重要性はどのツールを利用しても変わりません

AIツール種別 モデル
実装難易度
アーキテクチャ設計
/システム導入難易度
ナレッジの蓄積 汎用性
(ex.モデルを別のシステムから利用)
拡張性
(ex. 外部システムと連携)
#1 特化アプリケーション組み込み型 ベンダーに依存 ベンダーに依存
#2 API 連携型 (マネージドAI利用) ★★ ★★ ★★★ 周辺アーキテクチャの拡張性次第
#3 自社開発 (データ分析基盤利用) ★★★ ★★★ ★★★ ★★ 実装者の能力とアーキテクチャの拡張性次第

個人的に重要視している点は以下の通りです。

  • ナレッジ蓄積
    • 変化への対応可否に直結
    • 人材育成にも直結
    • 中長期的な組織活性には不可欠
  • 拡張性
    • 拡張性や汎用性が自社の要件に沿うか = クラウド上の基盤を強くお勧め (別記事で解説します)
    • 将来的に自社の優先度高い要件がベンダーのそれに合致するとは限らないことは留意
  • 開発コスト/運用コスト

技術難易度が非常に高い課題かつ業界で確立された手法がある場合は、#1 特化アプリケーション組み込み型の課題解決がいいと思いますが、個人的には、

  • #2 API 連携型と #3 自社開発 の併用
    • モデルの開発工数次第でスイッチ
    • 便利な API はどんどん使う
  • 過度にパートナーやベンダーに依存しない
    • 足りないところだけうまく補う
    • 補った分はうまく自社に取り入れる (うまく盗む)

が最もバランスが良いと考えてます。

データ分析のパターン

データ分析のパターンで分類します。
大枠ではこちらも 3 つです。

テーマ 主な利用主体 仮定は必須? 技術難易度 備考
#1 省人化 営利企業 ★★★ プロセスの改善が進むことでコストの低下が見込めるようなケース
・ex.発注業務の一部を代替可能な AIモデル
・ex.有人で検知していた異常を一定の精度で検出するAIモデル
業務設計や組織的な課題が関係してくる
#2 付加価値向上 営利企業 ★★★ ・ユーザーへの付加価値が向上することで売上向上が見込めるようなケース
・LVT(生涯顧客価値)など手法が確立されている分野も多い
#3 データマイニング 研究開発 × ★★★★★ ・集めたデータから何らかの傾向を発見する=データマイニング
・アカデミックな研究やそもそも仮説設定ができないケースが該当
・「データがあれば何かできそう」もこれに該当
目的が不明瞭なまま進行した場合、実証検証が失敗することが多い

ビジネスの場で成功している実証検証のほぼ 100% が #1 省人化 もしくは #2 付加価値向上 に該当します。
具体的な経営課題の解消をテーマに掲げる以上は、目的の明確化が必須です。
そのうえで仮設立案と検証のサイクルを回し、データ分析の結果をビジネス成果にに紐づけていきます。

注意しなくてはいけないのは、精度指標の類はモデルの状態を表すものであるという点です。
実際にモデルが活用される業務フローを踏まえたうえで、プロジェクト全体を評価する指標は別途設ける必要があります。
よってプロジェクトを進める前に以下をしっかり検討すべきでしょう。

  • 自社で取り組もうとしている課題は 1-3 どれに該当するのか?
  • 1 or 2 であれば AI モデルは自社の業務のどの部分に組み込まれるか?
  • 3 であれば仮説を立てて、1-2 の課題に昇華できないか?
  • モデルが業務に組み込まれた結果、業務プロセスはどのように変化するか?
  • モデルの出力結果は、何らかの形で既存 KPI と紐づけ可能か?

まとめ

私もそうですが、データ分析やAIのプロジェクトはどうしても手法に焦点が当たりがちです。
折に触れてこれらの点は見直すようにしたいところです。

この記事を書いた人

aws-recipe-user