レビュー

無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ


画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。

Introducing Whisper
https://openai.com/blog/whisper/


GitHub - openai/whisper
https://github.com/openai/whisper


○目次

この記事のタイトルとURLをコピーする

・関連記事
OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能 - GIGAZINE

画像生成AI「DALL・E 2」で絵柄はそのままに背景や続きを追加する新機能「アウトペインティング」が登場 - GIGAZINE

子どもが思い描く「ポケモンの物語」を文章生成AI「GPT-3」と画像生成AI「DALL・E」のコンビで再現するとこんな感じ - GIGAZINE

面倒な文字起こし作業を一瞬で実行可能なLINE製AI音声認識アプリ「CLOVA Note」の使い方まとめ - GIGAZINE

in レビュー,   ソフトウェア,   ネットサービス,   ウェブアプリ,   無料メンバー, Posted by log1i_yk

You can read the machine translated English article here.