レビュー

Googleが無料で使える音声認識ツール「Google AI Edge Eloquent」をひっそりリリース


Googleが無料で使える音声認識ツール「Google AI Edge Eloquent」をiOS向けにリリースしました。プレスリリースやブログ投稿など何の発表もなく静かにリリースされたため、実際にどんなアプリなのかを確かめてみました。

Google AI Edge Eloquentアプリ - App Store
https://apps.apple.com/jp/app/google-ai-edge-eloquent/id6756505519


iPhoneでApp Storeの「Google AI Edge Eloquent」のページを開き、インストールして「開く」をタップします。


利用規約やプライバシーポリシーの画面が出るので「Continue」をタップ。


モデルのダウンロードが始まります。


「Uh, yeah, well. For the meeting. Let's do it 3pm? Thanks. Talk to you soon」と発音するよう指示されました。下部にあるマイクマークのボタンをタップします。


マイクへのアクセス権を求められるので「許可」をタップ。


できるだけ原文に忠実に、「Uh」や「well」なども丁寧に発音したところ、自動でテキストのクリーンアップが行われ「Yeah, for the meeting. let's do it 3:00 p.m. Thanks. Talk to you soon」ときれいなテキストに整えられました。「Next」をタップします。


Googleアカウントと接続することで自分のアカウント内のデータから辞書を作成できるとのこと。今回は接続せずに「Next」をタップしました。


音声認識は常にローカル環境で行われますが、テキストのクリーンアップはクラウドとローカルのどちらで処理するかを選択可能とのこと。右上のスイッチが「Off」であればローカルで全ての処理が完結することになります。「Next」をタップ。


これでチュートリアルは完了です。「Finish onboarding」をタップします。


英語での威力は十分理解できたので、日本語の認識もできないかを試してみましたが、途中で「Google」と発音した部分しか聞き取ってもらえませんでした。記事作成時点では英語のみの対応となっているようです。


Google Playにも同様のツールがリリースされていないかチェックしてみましたが、記事作成時点では存在していないようでした。

この記事のタイトルとURLをコピーする

・関連記事
Microsoftが音声生成モデル「MAI-Voice-1」・音声認識モデル「MAI-Transcribe-1」・画像生成モデル「MAI-Image-2」の3つのAI基盤モデルをリリース - GIGAZINE

日本語を含む10言語に対応した音声生成モデル「Qwen3-TTS」ファミリーがオープンソース化 - GIGAZINE

Metaが1600以上の言語に対応した文字起こしAI「Omnilingual ASR」を公開 - GIGAZINE

ドライブスルーに音声AIによる注文システムを導入した大手ファストフードチェーンがAIの活用法を再考している - GIGAZINE

GoogleのGemini 2.5で日本語を含む多言語の音声生成が可能に - GIGAZINE

in AI,   ソフトウェア,   スマホ,   レビュー, Posted by log1d_ts

You can read the machine translated English article Google quietly released 'Google AI Edge ….