【2018年版】Amazon AI 紹介 – Comprehend編-

こんにちはシュガーです。

今回はAWSが提供している機械学習サービスのうちの1つ、Amazon Comprehend についてご紹介をしたいと思います。

Amazon AI とは

Amazon AI とはAWSが提供しているAIソリューションの総称です。
現在AWSが提供しているMLサービススタックは以下のようになります。
AWS re:Invent 2017 で追加された MLサービススタックまとめ

Amazon Comprehend 概要

Amazon Comprehendとは機械学習を使用してテキスト内の関係性等を検出する自然言語処理サービスです。

Amazon Comprehendは以下の特徴を持ちます。
・キーフレーズ抽出
・感情分析
・エンティティ認識
・言語の検出
・トピックモデル
例えばAmazon.com内のある商品レビューに対して用語やカテゴリごとに整理したり、レビュー内容が肯定的か否定的か等分析したりできます。

2018年6月現在、英語とスペイン語に対応しております。
他の言語はAmazon Translateと組み合わせて対応させるのもいいですね。

利用方法

Amazon Comprehendはマネジメントコンソール、AWS CLI、AWS SDKから利用ができます。

マネジメントコンソールから利用する場合は
「Try Amazon Comprehend」を選択して「Input text」に自然言語処理を行いたい文章を入力します。


画面を下にスクロールして「Insights」で結果を確認することができます。
Entity…エンティティ認識
Key phrases…キーフレーズ抽出
Language…言語の検出
Sentiment…感情分析

下の画像はエンティティ認識での結果となります。
「July 5th, 1994」がDATE 、「Seattle」がLocationとしてカテゴライズされ正しく分類ができているのが見受けられます。

制限事項

分析する際の最大容量は以下となります。
エンティティ認識、感情分析、キーフレーズ抽出、言語検出:5,000バイトまで
トピックモデリング:1ファイルにつき100MBまで

料金と提供リージョン

【料金】
従量課金制で、処理されるドキュメントの合計サイズによって変動

■エンティティ認識、感情分析、キーフレーズ抽出、言語検出
1単位=100 文字
最低料金として各リクエストにつき3単位は必ず発生

10M単位まで
1単位 = 0.0001 ドル

10M~50M単位まで
1単位=0.00005 ドル

50M単位以上
1単位=0.000025 ドル

■トピックモデリング
100 MBまでは1ジョブあたり1ドル
100 MB超過以降は1 MBごとに 0.004 ドル

■料金例
例えば感情分析APIでTwitterからハッシュタグで絞った直近ツイート10,000件のエゴサーチを行おうとした場合の料金ですが
1ツイート = 3 (単位) ※文字数上限一杯と仮定
対象ツイート数 10,000 (件) = 10,000 (リクエスト)
単位合計3 (単位) * 10,000 (リクエスト) = 30,000 (単位)
30,000 < 10M のため1単位あたり0.0001ドル
料金 = 30,000 * 0.0001 = 3 (ドル) となります。

【リージョン】
2018年6月現在、4つのリージョンで利用が可能です。(バージニア北部・オハイオ・アイルランド・オレゴン)

最後に

ナレッジコミュニケーションではAmazon Comprehendをはじめとした、Amazon AIサービスを使ってみたい、活用したいといった方へ、データの収集からAIを用いた利活用までをトータルコーディネートする「Cloud AIおまかせプラン for AWS」サービスを提供しております。

ご興味、ご関心のある方はこちらまでご連絡お願いします。

この記事を書いた人

aws-recipe-user