Amazon Machine Learningの概要について

Pocket

こんにちは!HALです。

先日ついにAWSからクラウド上で機械学習サービスが利用できる、「Amazon Machine Learning」がリリースされましたね!

【AWS発表】Amazon Machine Learning – Data-Driven Decision at Scale

本日は機械学習って何??という方向けに「Amazon Machine Learning」の概要や活用例のご紹介をさせて頂きたいと思います。

■Amazon Machine Learningの概要

Amazon Machine Learning は、データ解析の専門的な知識がなくてもクラウド上で「機械学習によるデータ分析」ができるマネージドサービスです。

現状提供されているアルゴリズム(分析手法)は以下があります。

①二項分類
入力されたデータを2つの選択肢のどちらかに分類します。
例)メールがスパムであるかどうかをYES/NOで分類

②多項分類
入力されたデータを3つ以上の選択肢のいずれかにに分類します。
例)商品なのか、DVDなのか、もしくは食べ物なのかを分類

③回帰分析
線形回帰による値の予測に利用します。
例)過去のデータから商品の在庫はいくら用意すると良いかを分析

※機械学習とは?
過去のデータを元に将来の予測を行う分析手法です。
Wikipediaでは、以下のように記載されています。

センサやデータベースなどから、ある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出し、アルゴリズムを発展させる。
なお、データ集合を解析するので、統計学との関連が深い。
そのアルゴリズムは、第一にそのデータが生成した潜在的機構の特徴を捉え、複雑な関係を識別(すなわち定量化)する。

第二にその識別したパターンを用いて、新たなデータについて予測を行う。
データは、観測された変数群のとりうる関係の具体例と見ることができる。

一方、アルゴリズムは、機械学習者として観測されたデータの部分(訓練例などと呼ぶ)を学習することで、データに潜在する確率分布の特徴を捉え、学習によって得た知識を用いて、新たな入力データについて知的な決定を行う。

■機械学習と従来の分析との比較

従来は分析には人手が必要でしたが、機械学習では分析からモデル化まで機械が行い、且つ分析結果の反映も自動で行ってしまうとっても便利なものになります。

図1

■特徴

Amazon Machine Learningの特徴としては以下があります。

①専門知識がなくても利用可能
アルゴリズムもデータの特性に応じて自動的にアルゴリズムを選択してくれます。

②作成された機械学習の分析ロジックの品質の評価ができる
デフォルト設定の場合、評価用のデータ(はじめにモデルを作成するために利用する過去のデータ)
の7割を教師データ(事前に与えられた元データ)としてアルゴリズムを作成して、3割を作成されたアルゴリズムの評価ができるものになっています。

③コストが安い
一般的なオンプレミスで構築する機械学習のシステムと比較してコストが安く利用できます。あくまで一般論になってしまいますが、理由としては以下の点が挙げられると思います。
◯一般的にアルゴリズムを専門会社等から購入もしくは開発する場合は非常に高額になります。AWSの場合はサービスとして利用できますので、購入、開発の必要がございません。

◯オンプレミスで機械学習のアルゴリズムを利用する場合、大量のマシンリソースが必要となり、インフラ運用面でも多くの費用が発生します。クラウドなのでその必要がないですよね。

■料金

以下公式サイトより抜粋します。

Amazon Machine Learning 利用分に応じた従量課金です。
以下の2つに料金が発生します。

① 予測モデルの構築に使用したコンピューティング時間の時間料金
② アプリケーションで生成した予測の件数に対する料金

データ分析およびモデル構築料金 0.42 USD/時
予測料金 バッチ予測 予測 1,000 件当たり 0.10 USD(百の位以下の端数を切り上げ)
リアルタイム予測 予測当たり 0.0001 USD(0.01 USD 以下の端数は切り上げ)

■活用例

◯属性分類
ユーザーの行動ログでサイトに訪問するユーザーの属性情報を推定して、カテゴリ分けをすることが出来ます。

◯サーバログを利用した不正検知
ネットワーク上のログを利用し侵入や攻撃を検知することが出来ます。さらに、データ内にある異常や危険のあるデータを検知することができます。

◯需要予測
過去の日付、時間、曜日に加え温度や湿度といったデータを利用し需要の予測を行うことが出来ます。

◯リスク分析
サービスから解約する可能性が高いユーザーを割り出し、個別サービスを提供することで解約率を減少することが出来ます。

いかがでしたでしょうか?

Machine Learningのレシピはこれからもどんどん出して行きたいと思います。
ナレコムではAmazon Machine Learningのインテグレーションサービスを提供しております。

ご興味ある方は是非お問い合わせください!