Amazon Rekognitionの機能をいちから紹介

今回はAWSで今(個人的に)アツイAIサービスの中から画像分析と動画分析を簡単に実装できるAmazon Rekognitionについて紹介します。

Amazon Rekognitionの概要

Amazon Rekognition は、AWSで画像分析とビデオ分析が利用できるサービスです。

Rekognition API に画像やビデオを指定するだけで、モノ、人物、テキスト、シーン、アクティビティを識別することができます。
それだけではありません、アダルトコンテンツかどうかなどの不適切なコンテンツも検出できます。
また感情や特徴など、高精度な顔分析および顔認識も可能です。

Amazon Rekognitionを使用するのにユーザーに嬉しいのは機械学習についての専門的な知識を必要としないところです。
いわゆるすぐに使える、というやつですね。
またAPIも含まれるため、Amazon S3 に保存されている画像ファイルやビデオファイルを即座に分析することができます。
それでは実際にどんなことできるか、見てみましょう。

利用できる画像は?

Amazon Rekognitionで利用できる画像のサイズは5MBまでのJPEGまたはPNG形式の画像になります。

どんなことができるか?

■画像内のラベル検出
画像からラベルを検出します。例えば海辺の写真なら海、岩、灯台、砂浜などのラベルが検出されます。
戻り値はラベルとその信頼度(0-100)、画像の向き(0/90/180/270度)です。

■顔の検出
Amazon Rekognition では、顔コレクションというコンテナに保存されているものと一致する顔がないか、画像、保存ビデオ、ストリーミングビデオを検索できます。
顔コレクションとはユーザーが所有および管理する顔のインデックスのことです。
Amazon Rekognition を使用して顔で人を識別するには、「顔のインデックスを作成する」「顔を検索する」の 2 ステップで利用できます。
また感情の分析なども可能です。

■有名人の認識
指定の画像内やビデオ内の有名人を認識することができます。Rekognition では、政治、スポーツ、ビジネス、エンターテインメント、メディアなどのさまざまな分野にわたる多数の有名人を認識することが可能です。
各国の首脳が並んでいる写真を試したところ、顔がものなどに重なってしまっている人物以外は認識できました。
しかし有名人とはどのレベルからなのか、気になるところですね。

■安全でないコンテンツの検出
画像やビデオ内の明示的および暗示的なアダルトコンテンツを検出できます。ユーザーは、定められた規定に基づき、返されたメタデータを使用して不適切なコンテンツをフィルタできます。
こちらも男性のボディビルダー?で試したところMale nudieとでました。ブーメランパンツだったのがポイントでしょうか笑

■テキストの検出
画像のテキストコンテンツを認識して抽出することができます。
Text in Image では、高度に図案化されたフォントも含め、大部分のフォントをサポートしていますが2018年1月時点ではLaten文字(いわゆるアルファベット)のみ対応しています。

まとめ

分析する画像や動画によって様々な結果がでるので、いろいろ試すことでビジネスに生かせるようなアイデアが出るような気がしますね!
機能的にまだ物足りないかな?と感じる部分はありますが今後のアップデートに期待です。

次回もお楽しみに!!

この記事を書いた人

aws-recipe-user