レビュー

無料で自動文字起こししてくれるMicrosoft製アプリ「Group Transcribe」を使ってみた


Microsoftが、誰が何を話したのかリアルタイムで文字化して記録してくれる、無料の文字起こしアプリ「Group Transcribe」を公開していたので、実際に使ってみました。

「Group Transcribe」をApp Storeで
https://apps.apple.com/jp/app/group-transcribe/id1527145885

iOS端末でApp Storeにアクセスして「Group Transcribe」を入手します。


インストールするとアプリの説明画面が4枚表示されます。「次へ」をタップするか、右へスワイプして進めていきます。


最後の説明画面で「始めましょう。」をタップ。


利用規約が表示されるので「承認」をタップ。


表示名と言語を入力します。


言語はプルダウン式メニューになっていて、かなり多数の言語が用意されています。ここで設定された言語をベースに文字起こしが行われます。


初回起動時のみBluetoothの使用を求められるので「OK」をタップ。


基本画面はこんな感じ。下部の「開始」をタップすると、自分がホストとなってセッションを開始します。


最初にセッションを開いたときだけマイクの使用を求めるダイアログが出るので「OK」をタップ。


アルファベット5文字の名前が自動付与されたセッションが始まります。ゲストとしてログインしたい場合は、このセッション名を入力して「参加」すればOK。ちなみに、早速「あった」という文字起こしがされていますが、これはセッションを開始したときに近くにいた編集部員がつぶやいた言葉をマイクが拾ったもの。


なお、ホストが左上の「<」をタップするとセッション終了ダイアログが表示されます。終了すると、文字起こしした内容はその状態で保存されます。


また、セッション画面の右上のアイコンをタップすると様々な方法で文字起こし内容を共有可能です。


設定画面はこんな感じ。表示名や言語は後から変更可能です。また、デフォルトでは録音内容はMicrosoftに投稿されない設定となっていますが、音声認識技術向上のために投稿することも可能です。


音声がクリアに聞こえる状態であれば、たとえばYouTubeのムービーを再生しつつ文字化するということも可能です。

実際に、株式会社カラー公式チャンネルで公開されている新世紀エヴァンゲリオン 第壱話「使徒、襲来」を再生しつつアプリを使ってみたところ、オープニング後の冒頭部分にあるアナウンス音声「本日12時30分、東海地方を中心とした関東・中部全域に特別非常事態宣言が発令されました」という部分は、かなり忠実に文字起こしされました。


そのアナウンスに重なるように、葛城ミサトがつぶやいた「よりによって、こんな時に見失うだなんて。まいったわね……」という独り言は、アナウンスとの切れ目がないため、連続で文字起こしされました。


一方、電話がつながらずに困るシンジ。「しょうがない、シェルターに行こう」が「しょうがないせるために行こう」になってしまっていますが、原型はほぼ残っているのがわかります。


いろいろ使ってみた感じ、くだけた口調の口語で早口だと、ちょっとうまく聞き取りできない部分が出るものの、一方で、耳で聞いたときに「これは文字起こしは難しいかも」というフレーズをきっちり拾える部分もありました。聞き取ったそのままだと不正確だった部分を、文脈を判断して、正確な内容として確定させる事例もありました。全体的に、このアプリで文字起こしした内容をベースに完成品を作るのはアリなのではないかという印象です。

なお、「Group Transcribe」のAndroid版やWindows版がリリースされる予定があるのかは不明です。

この記事のタイトルとURLをコピーする

・関連記事
Microsoftがリアルタイム翻訳&文字起こしが可能な会議用スマートスピーカーを発表 - GIGAZINE

Google Chrome上でマイクから録音した声をリアルタイムで文字に書き起こしてくれる「The Recording Studio」 - GIGAZINE

YouTubeムービーの内容を自動的に文字起こししてくれる「AIメーカー」の文字起こし機能を使ってみました - GIGAZINE

in レビュー,   ソフトウェア, Posted by logc_nt

You can read the machine translated English article here.