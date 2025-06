Apple's New Transcription APIs Blow Past Whisper in Speed Tests - MacRumors https://www.macrumors.com/2025/06/18/apple-transcription-api-faster-than-whisper/ Appleは、メモやボイスメモなどのアプリのリアルタイム文字起こし機能や、iOS 18.1の通話音声文字起こし機能に、独自のネイティブ音声フレームワークを使用しています。iOS 26とmacOS Tahoeでは効率性を向上させるため、SpeechAnalyzerクラスと SpeechTranscriber モジュールが導入されました。 このmacOS TahoeのSpeechAnalyzerを使って文字起こしができるCLI「 Yap 」を、ボーヒーズ氏の息子でエンジニアのフィン氏が開発。フィン氏から「SpeechAnalyzerは処理が非常に高速」と聞いたボーヒーズ氏はYapを用いて、長さ約34分・解像度4K・ファイルサイズ約7GBの 動画ファイル の音声をテキストに変換しました。その結果、わずか45秒でテキスト変換の処理が完了したとのこと。 以下のムービーは、実際にYapで文字起こしを行っている様子。 ボーヒーズ氏によれば、同じファイルをWhisperのLarge-v3モデルで行うと文字起こしに1分41秒かかったそうで、SpeechAnalyzerは処理時間が55%も短縮できていることになります。また、Whisperベースの他のツールでは、 VidCap だと1分55秒、 MacWhisper でLarge-v2モデルを使うと3分55秒かかったそうで、SpeechAnalyzer APIで文字起こしが爆速になっていることがわかります。文字起こししたテキストの品質については、ボーヒーズ氏は「目立った違いはない」と評価しています。

2025年06月19日 23時00分00秒 in ソフトウェア, 動画, Posted by log1i_yk

You can read the machine translated English article Apple's new transcription API 'Speec….