今回は天候データをAmazon Machine Learningに流し込み3つの方法(二項分類、多項分類、回帰分析)で天気予測をしてみます。
今回は第1-4回に渡って行ってきた内容のまとめとなります。
「もっとも簡単な機械学習サービスであるAMLを理解する」
ところどころ専門用語はありますが、かなり簡単に使えることは感じる事ができるかと思います。
データさえあれば、必要なフォーマットに変換してS3(またはRedshift)にアップロードして、機械学習に流しこむだけで利用できます。
統計の知識が無くても、機械学習の方式や属性情報(アトリビュート)の重み付けなどはAmazon Machine Learningが自動的にやってくれて、その結果もManagement Console上に詳しく表示されます。
この結果データさえきちんと読むことが出来れば、今直ぐ利用することができるでしょう。
「同一データに対して3つの方法を利用することで3つの違いを掴む」
AMLの良さである属性情報の重み付け等を体感できる様にあえて同じデータで行いました。
同じデータで3つのアルゴリズムを利用することで、3つの違いがより分かりやすくなると思います。
0か1か | 二項分類 |
ABCのどれに近いか | 多項分類 |
どんな値になるか | 回帰分析 |
また、機械学習の話をする上で○○というアルゴリズムを使うにはどんなデータが必要になるか、という事を聞かれますが、元データ以上にやりたい項目に合わせた加工が重要となります。
「機械学習に対する属性情報の重要性を掴む」
機械学習では、属性情報を追加することで精度が上がります。
2回目、3回目では属性を変えることでどんな影響を与えるかを確認しています。特に3回目では項目を減らすことで精度が上がっており、一概に項目を増やせばいいわけではないという参考にもなると思います。
「まとめ」
jubatusやmahoutなどで行ってきた機械学習をこんなに簡単に利用することが出来るようになりました。
機械学習では、これまでのデータ分析の様に過去の結果を振り返るだけでなく未来を予測することが出来るので、活用することで将来の売上の増加やリスク回避など様々な事で役に立てることが出来ます。
是非皆さんも機械学習を使って、より良い企業データの利活用をしましょう!
ナレコムクラウドでは機械学習を含めたAIやロボットといった事に興味があるエンジニアを募集しております。未経験の方でも興味がある方はお気軽にお問い合せ下さい。
◯Amazon Machine Learning
第1回
Amazon Machine Learningを理解するために3つの方法で天気予測をしてみた(二項分類編)
第2回
Amazon Machine Learningを理解するために3つの方法で天気予測をしてみた(多項分類編)
第3回
Amazon Machine Learningを理解するために3つの方法で天気予測をしてみた(回帰分析編)