【2018年版】Amazon AI 紹介 -Transcribe編-

Pocket

こんにちはシュガーです。

今回はAWSが提供している機械学習サービスのうちの1つ、Amazon Transcribe についてご紹介をしたいと思います。

Amazon AI とは

Amazon AI とはAWSが提供しているAIソリューションの総称です。
現在AWSが提供しているMLサービススタックは以下のようになります。
AWS re:Invent 2017 で追加された MLサービススタックまとめ

Amazon Transcribe 概要

Amazon Transcribeとは音声をテキストへと変換してくれるSpeech to Textサービスです。
Amazon TranscribeはAmazon S3 に保存されているオーディオファイルを分析してテキストファイルへと変換してくれるため、コールセンター、サポートセンターの音声の文字起こし、会議の議事録などといったことができます。

2018年6月現在、英語とスペイン語に対応しております。残念ながら日本語は未対応です。

Amazon Transcribeは単純な文字起こしだけでなく、話者の識別をすることも可能で、個人名や、略語等の語彙を追加登録(カスタム語彙)することもできます。

利用方法

Amazon Transcribeはマネジメントコンソール、AWS CLI、AWS SDKから利用ができます。

・前提
Amazon Transcribeを利用する場合まず、S3に音声データを保存しておく必要があります。
今回サンプルとして一般提供された際のAWSブログにある音声データを使わせていただきました。

マネジメントコンソールから利用する場合は「Transcription jobs」から「Create job」を選択します。

「Create transcription job」では以下の項目を入力していきます。
・Name
管理ジョブ名です。一意である必要があります。

・S3 input URL
文字起こししたいファイルが保管されているS3のパスを指定します。
※Amazon TranscribeとS3バケットを同リージョンにする必要あり

・Language
テキストへと変換する言語を選択します。現在は英語かスペイン語のみ選択可能。

・Format
ファイル形式を選択します。

・Audio sampling rate (Hz) – optional
オーディオファイルのビットサンプリングレートを8000~48000 Hzの間で使用できます。オプションのため入力しなくても良いです。

・Apply custom vocabulary – optional
カスタム語彙の登録を行っている場合はこちらで設定できます。

・Speaker identification
話者の識別を行うか選択します。
有効化する場合は話者の人数を指定することで精度があがるようです。(最大10人まで)

最後に「Create」と選択するとテキスト変換が開始されます。

最初の「Transcription jobs」に戻ると、先程「Name」で指定したジョブ名があると思います。
「Download」とすればjson形式のテキストデータがダウンロードできます。
ジョブ名を選択すれば詳細画面を見ることができます。
※ジョブは90日間保持され90日を経過すると削除されます。

詳細画面
下にスクロールするとjsonデータを見ることもできます。

制限事項

Amazon Transcribeを利用する上での制限事項は以下となります。
・Amazon Transcribeで変換できるオーディオファイルは1回につき2時間にまで
・語彙登録は1つにつき最大256 文字、50 KBまで

料金と提供リージョン

・料金
従量課金制で1秒あたり0.0004ドルです。
為替を120円と計算した場合ですが1秒あたり0.048円となりますね。
※15秒未満のリクエストについては最低料金として15秒分の料金が発生します。

【提供リージョン】
2018年6月現在、4つのリージョンで利用が可能です。(バージニア北部・オハイオ・アイルランド・オレゴン)

最後に

Amazon Transcribe は昨年のAWS re:Invent 2017 で発表され、当時はプレビューでしたがその後半年以内に一般公開されたサービスです。
Amazon Translateと同時期同タイミングで発表、一般公開されており、こちらも非常にアップデートが早そうなサービスです。

ナレッジコミュニケーションではそんなAmazon Transcribeをはじめとした、Amazon AIサービスを使ってみたい、活用したいといった方へ、データの収集からAIを用いた利活用までをトータルコーディネートする「Cloud AIおまかせプラン for AWS」サービスを提供しております。

ご興味、ご関心のある方はこちらまでご連絡お願いします。