こんにちは!Narimasaです!
re:Inventで発表された人工知能系サービスの一つである「Amazon Polly」でレキシコンを使って音声の調整を
試してみます。
前回の記事はこちら
Amazon Polly編~コンソール画面から操作してみる~
レキシコンとは?
レキシコンは言語学でいうところの「語彙目録」を意味しており、Amazon Pollyでは「発音レキシコン」として単語の
言い換えや独特の発音を登録・表現することができます。
例えるとパソコンのユーザー辞書に単語を登録し、文章変換時にその単語を表示させるようなものです。
Amazon Pollyでレキシコンを使用するには予めPronunciation Lexicon Specification (PLS) ファイルとしてXML形式で
作成をする必要があります。
単語を言い換えてみる
今回は下記の様にPLSファイルを作成しました。
1 2 3 4 5 6 7 8 9 10 11 12 13 |
<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>BFF</grapheme> <alias>best friend forever</alias> </lexeme> </lexicon> |
主に内容を記述するのは
テキスト内で変換元になる語句を記載します。
上記例では英語圏でスラングとして使われる「BFF」を記載しています。
元の語句からの変換する内容を記載します。
上記例ではBFFの意味である「best friend forever」を記載しています。
※その他に「xml:lang=”en-US”」の記述を変更することで言語を変更できるようですが、
今のところ、日本語は上手くいきませんでした。
では早速レキシコンをアップロードして読み上げさせてみます。
AWSコンソールで使う場合は、前回同様Pollyのテキスト読み上げ機能ページを開き、画面下部の「発音のカスタマイズ」をクリックします。
「レキシコンをアップロード」アイコンをクリックし、PLSファイルを選択します。
アップロードしたレキシコンが下記の画面の様になっていればレキシコンが適用されています。
早速、レキシコンが適用されるようなテキストを準備し発音させてみます。
レキシコン通り、「BFF」という語句を「best friend forever」と読み上げてくれました。
発音を変更させてみる
今度は発音を変更させてみます。
下記のようにPLSファイルを作成します。
1 2 3 4 5 6 7 8 9 10 11 12 13 |
<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>tomato</grapheme> <phoneme>təmάːtəʊ</phoneme> </lexeme> </lexicon> |
1 2 3 4 5 6 7 8 9 10 11 12 13 |
<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>tomato</grapheme> <phoneme>təmάːtəʊ</phoneme> </lexeme> </lexicon> |
発音を変更する際も先ほどと同様に
先ほどと同様にテキスト内で変換元になる語句を記載します。
上記例ではアメリカ英語とイギリス英語で発音が異なる「トマト」を記載しています。
この「təmάːtəʊ」はイギリス英語でのトマトの発音です。
上記PLSファイルをPollyにアップロードし、「I have a tomato」と読み上げさせてみます。
言語設定はen-US(アメリカ英語)としているので、アメリカ英語読みの文章の中にイギリス英語読みが登場することに
なります。
違いが分かるようにレキシコン無し(全てアメリカ英語)で「I have a tomato」と読み上げさせてみます。
いかがでしょうか。
「トマト」の発音を変更することができました。
なお、アップロードしたレキシコンは左メニューの「レキシコン」ページで管理することができます。
今回ご紹介したレキシコンをうまく使えば、ネットスラングに溢れた世俗的な文章を読み上げさせることもできますし、
特定の単語だけ訛らせることもできます。
日本語対応がされればもっと面白い使い方ができそうですね。
次回もお楽しみに!!