ソフトウェア

MozillaがOpenAIのWhisperベースの高性能文字起こしAI「Whisperfile」を開発中


ウェブブラウザ「Firefox」などを開発するMozillaが、OpenAIの「Whisper」ベースの文字起こしAI「Whisperfile」を開発中であることを発表しました。Whisperfileでは、英語以外の音声を英語に翻訳することも可能とのことです。

Mozilla/whisperfile · Hugging Face
https://huggingface.co/Mozilla/whisperfile


Mozilla Developing Whisperfile For Local Audio-To-Text Translation - Phoronix
https://www.phoronix.com/news/Mozilla-Whisperfile

Mozillaが開発中のWhisperfileは、OpenAIの文字起こしAI「Whisper」で使われるwhisper.cppソフトウェアをベースに構築されているとのこと。WhisperfileはLinuxやMacOS、Windows、FreeBSD、OpenBSDなどのシステムで実行可能。また、Whisperfileはx86_64とAArch64の両方で動作します。

Whisperfileを実行すると、wav・mp3・ogg・flac形式の音声ファイルが自動的にテキストに書き起こされます。また、音声認識の信頼度を色分けすることも可能です。


MozillaによるとWhisperfileは英語以外の音声を英語に翻訳することもできるとのこと。

また、以下のコマンドを実行するとHTTPサーバーの利用が可能です。

./whisper-tiny.en.llamafile


以下のコマンドではマニュアルページの閲覧ができます。

./whisper-tiny.en.llamafile --help


なお、MozillaはWhisperfileのソースコードやインストール方法などを公式GitHubリポジトリで公開しています。

Whisperfile Documentation · GitHub
https://github.com/Mozilla-Ocho/llamafile/blob/6287b60/whisper.cpp/doc/index.md

この記事のタイトルとURLをコピーする

・関連記事
OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能 - GIGAZINE

無料&セルフホスト可能なブラウザ上で操作できる文字起こしツール「Transcription Stream」レビュー - GIGAZINE

1100以上の言語で音声からの文字起こしや文章の読み上げが可能な音声認識モデル「Massively Multilingual Speech(MMS)」をMetaが発表 - GIGAZINE

自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告 - GIGAZINE

AppleがiOS 17.4をリリース、新しい絵文字・ポッドキャストの文字起こし対応・デフォルトブラウザの選択・サードパーティーブラウザエンジンのサポートなど - GIGAZINE

超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた - GIGAZINE

文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK - GIGAZINE

in ソフトウェア, Posted by log1r_ut

You can read the machine translated English article here.