Googleが無料で使える音声認識ツール「Google AI Edge Eloquent」をひっそりリリース

Googleが無料で使える音声認識ツール「Google AI Edge Eloquent」をiOS向けにリリースしました。プレスリリースやブログ投稿など何の発表もなく静かにリリースされたため、実際にどんなアプリなのかを確かめてみました。
Google AI Edge Eloquentアプリ - App Store
https://apps.apple.com/jp/app/google-ai-edge-eloquent/id6756505519
iPhoneでApp Storeの「Google AI Edge Eloquent」のページを開き、インストールして「開く」をタップします。

利用規約やプライバシーポリシーの画面が出るので「Continue」をタップ。

モデルのダウンロードが始まります。

「Uh, yeah, well. For the meeting. Let's do it 3pm? Thanks. Talk to you soon」と発音するよう指示されました。下部にあるマイクマークのボタンをタップします。

マイクへのアクセス権を求められるので「許可」をタップ。

できるだけ原文に忠実に、「Uh」や「well」なども丁寧に発音したところ、自動でテキストのクリーンアップが行われ「Yeah, for the meeting. let's do it 3:00 p.m. Thanks. Talk to you soon」ときれいなテキストに整えられました。「Next」をタップします。

Googleアカウントと接続することで自分のアカウント内のデータから辞書を作成できるとのこと。今回は接続せずに「Next」をタップしました。

音声認識は常にローカル環境で行われますが、テキストのクリーンアップはクラウドとローカルのどちらで処理するかを選択可能とのこと。右上のスイッチが「Off」であればローカルで全ての処理が完結することになります。「Next」をタップ。

これでチュートリアルは完了です。「Finish onboarding」をタップします。

英語での威力は十分理解できたので、日本語の認識もできないかを試してみましたが、途中で「Google」と発音した部分しか聞き取ってもらえませんでした。記事作成時点では英語のみの対応となっているようです。

Google Playにも同様のツールがリリースされていないかチェックしてみましたが、記事作成時点では存在していないようでした。
・関連記事
Microsoftが音声生成モデル「MAI-Voice-1」・音声認識モデル「MAI-Transcribe-1」・画像生成モデル「MAI-Image-2」の3つのAI基盤モデルをリリース - GIGAZINE
日本語を含む10言語に対応した音声生成モデル「Qwen3-TTS」ファミリーがオープンソース化 - GIGAZINE
Metaが1600以上の言語に対応した文字起こしAI「Omnilingual ASR」を公開 - GIGAZINE
ドライブスルーに音声AIによる注文システムを導入した大手ファストフードチェーンがAIの活用法を再考している - GIGAZINE
GoogleのGemini 2.5で日本語を含む多言語の音声生成が可能に - GIGAZINE
・関連コンテンツ
in AI, ソフトウェア, スマホ, レビュー, Posted by log1d_ts
You can read the machine translated English article Google quietly released 'Google AI Edge ….







