ネットサービス

Amazonがテキストをネイティブレベルの自然な音声に変換する「Amazon Polly」を発表、24の言語と47の音声に対応

By Stephen Poff

Amazon Web Services(AWS)が人工知能サービスの「Amazon Polly」をラスベガスで実施されたイベント「AWS re:Invent 2016」で発表しました。Amazon Pollyはテキストを音声で読み上げるサービスで、24の言語と47の音声に対応しています。

Amazon Polly – 文章から音声へ、47の声と24の言語 | Amazon Web Services ブログ
https://aws.amazon.com/jp/blogs/news/polly-text-to-speech-in-47-voices-and-24-languages/

Amazon Polly – Lifelike Text-to-Speech
https://aws.amazon.com/jp/polly/

Amazon Lex – Build Conversational Voice & Text Interfaces | AWS Blog
https://aws.amazon.com/jp/blogs/aws/amazon-lex-build-conversational-voice-text-interfaces/

AWSが発表したAmazon Pollyはクラウドサービスの1つで、入力されたテキストを音声で読み上げるサービスです。Amazon Polly自身のツールとアプリケーションを使ってテキストを音声に変換し、47の男性&女性の声と日本語を含む24の言語に対応しています。


Pollyの特長はネイティブスピーカーと共に開発を進めた正確な認識機能です。例えば、「I live in Seattle」と「Live from New York」という文章における「live」は、同じスペルでありながら異なる発音と意味を持つ同形異義語になるのですが、Amazon Pollyは同形異義語を認識して異なる発音で読み上げてくれます。

Pollyコンソールがすでに公開されており、AWSメンバーなら誰でも試すことが可能です。

Amazon Polly
https://console.aws.amazon.com/polly

Pollyは毎月500万字までは無料、それ以上は1文字につき0.000004ドルかかり、音声1分あたり約0.004ドルになるとのこと。Pollyを利用すれば、音声対応のアプリケーションを今までより簡単に開発できる可能性があります。

AWSはもう1つの人工知能サービスとして、「Amazon Lex」も発表しています。Amazon Lexは、同社のパーソナルアシスタント「Amazon Alexa」で採用されているディープラーニング技術を使ってチャットボットのような会話式インターフェースを構築可能なサービスです。


Amazon Lexはテキストと音声による2タイプの会話式インターフェースに対応。Alexaは音声コントロールのWi-Fiスピーカー「Amazon Echo」に搭載されていますが、日本では未発売のデバイスです。このAlexaの自然言語処理機を使って、テキスト形式のチャットボットや音声認識可能なアプリを開発可能になります。

Amazon Lexはノーザンバージニア(北バージニア)リージョン向けにプレビュー版を公開中です。価格は、初年度に限りテキストリクエスト1万回、音声リクエスト5000回が無料。それ以降は、テキストリクエスト1000回ごとに0.75ドル(約85円)、音声リクエスト1000回ごとに4ドル(約470円)の料金がかかります。

この記事のタイトルとURLをコピーする

・関連記事
GoogleのAIは専門家よりも高精度な読唇術が可能 - GIGAZINE

Amazonがコンビニ事業へ参入する可能性、食料品を扱う実店舗の展開を検討中 - GIGAZINE

AI(人工知能)に対するありがちな「誤解」とそれに対する回答まとめ - GIGAZINE

ロボット化が進む最新のAmazonの出荷倉庫「フルフィルメントセンター」で商品が出荷される様子 - GIGAZINE

Googleの人工知能や機械学習をスマホのカメラやお絵かきで体験できるデモ集「A.I. Experiments」 - GIGAZINE

in ネットサービス,   ウェブアプリ, Posted by darkhorse_log

You can read the machine translated English article here.