Amazon Sumerian Tutorial 31:Text-to-Speech with the Speech Component

こんにちは、ナレコム前川です!

今回は、前回作成したIDを使ったチュートリアルを進めていきたいと思います。
これから行うチュートリアルは、Amazon Sumerian の公式チュートリアルの
Text-to-Speech with the Speech Component です。

ここでは、

  • AWS Configuration
  • Cognito Identity Pool ID
  • Speech Component
  • Hosts
  • Physics
  • State Machine

の5つについて学んでいきます。

それでは、さっそく進めていきましょう。

1. AWS の前提条件

このチュートリアルでは、AmazonPollyReadOnlyAccess の Pool ID が必要となります。
作成が行えていない場合には、コチラの記事 を見ながら作成を行ってください。

2. シーンの作成

それでは、いつものようにダッシュボードからシーンを作成していきます。
Empty シーンを選択し、シーン名を「Speech Component Tutorial」にしてください。

3. AWS Configuration の設定

ここでは、前回作成した Pool ID をシーン内で設定していきます。
今回のシーンでは、Amazon Polly API との連携を行い、Sumerian 上で使えるようにします。
※Amazon Polly は、テキストを音声に変換し、話してくれるものです。

① Entities パネルからSpeech Component Tutorialをクリック。

② Inspector パネルから AWS Configuration を展開し、Pool ID を入力

この設定で、Amazon Polly API を使えるようになります。

4. Entity の作成

次に、エンティティを作成していきます。

Create Entity を選択。
Box を選択。

5. Speech Component の追加

それでは、Box に Speech Component を追加していきましょう。

① Box を選択し、Inspector パネルから Add Component を選択。

Speech Component をクリックし、追加。

6. Speech の追加

ここでは、エンティティに話させる内容を設定していきます。

Speech を追加する際には、2つの方法があります。

① 新しい Speech ファイルを作成し、エディタでスクリプトを入力する
② わかりやすいテキストもしくはSSML ファイルをアップロードする

ここでは、両方の方法で Speech を設定していきます。

① 新しい Speech ファイルを作成する方法

Inspector パネルの Speech Component を展開。

Voice から 音声を選ぶことができます。
日本語を話させたい場合には、「Mizuki」「Takumi」のどちらかを設定してください。

Volume も設定することができます。

新規ファイルを作成する際には、以下の+ ボタンをクリックしてください。

クリックすると、エディタが開きます。

Speech のコードを書く場合には、

の間に内容を書きます。

※エディタを閉じる際には、Save を忘れないでください。

② ファイルをアップロードする方法

まずは、以下のファイルをダウンロードしてください。

welcome.txt

ダウンロードしたファイルを以下の部分にドラッグ&ドロップします。

以上が Speech の設定になっています。

7.スピーチファイルにスピーチマークを追加

テキストファイルをアップロードした場合には、そのファイルを自動的にSSML に変換します。
SSML に変換することで、アニメーションなどが使用できるようになるためです。

Speech Component の Speech ファイル一覧を見てください。

4つのボタンがそれぞれ追加されているのがわかると思います。
左から

  • ・再生ボタン
  • ・編集ボタン
  • ・スピーチマーク自動生成
  • ・削除ボタン

になっています。

それでは、welcome.txt の左から3番目のスピーチマークの自動生成ボタンをクリックしてください。

8. スピーチファイルの編集

それでは、welcome.txt の編集ボタンをクリックしてエディタを開いてください。

開くと、以下のようになっているはずです。

はジェスチャーをつけるときに使用するコードです。
確認したら、エディタを閉じます。

9. スピーチファイルの再生

スピーチファイルを再生していきます。

スピーチファイルの横にある再生ボタンをクリックしてください。
※シーンの再生ボタンではないので注意してください。

10. ステートマシンを使用してスピーチファイルの再生

それでは、ステートマシンを追加していきましょう。

まず、Box エンティティを選択し、Inspector パネルから Add Component をクリックします。
そして、State machine を追加しましょう。

+ ボタンをクリックして、追加された Behavior の編集ボタンをクリックしてください。

ステートマシンの編集画面が出てきたら、State 1 の設定を行っていきます。
Inspector パネルから Add Action をクリックしてください。

そして、「AWS SDK Ready」を追加してください。

次に、Add State をクリックし、State 2 を追加します。
追加後、Add Action から「Start Speech」を選択し、追加します。

追加できたら、Start Speech アクションの設定をしていきましょう。
Speech から welcome.txt を選択します。

そして、State 1 と State 2 を矢印で以下のように結んでください。

それでは、再生してみてください。短いですが、音声が聞けると思います。

シーン再生を止めて、もう少し機能を追加していきます。

Add State から State 3 を追加し、Add Action「Key Pressed」 を追加します。

追加したら、KeyUparrow に設定します。
※十字キーの↑ボタンを押せば自動的に設定されます。

次に、State 4 を追加して、「Start Speech」アクションを追加してください。
追加したら、SpeechSpeech ファイルを設定します。

続いて、State 4 には「Key Pressed」アクションも追加し、Key を Downarrow に設定します。

最後に、State 5 を追加し、「Stop Speech」アクションを追加します。
追加したら、SpeechSpeech ファイルを設定してください。

そして、以下のように矢印をつなげます。

以上ができたら、シーンを再生してみてください。

↑ボタンを押すと、Speech ファイルが再生されます。
話の途中で、↓ボタンを押すと話すのをやめます。

今回のチュートリアルは以上です。
お疲れ様でした。

この記事を書いた人

aws-recipe-user