レビュー

長時間のゲームプレイ映像から爆速でショート動画を自動生成できる「AutoShorts」


長時間のゲームプレイ映像からAIが重要シーンを解析・抽出し、字幕やナレーション付きの縦型ショート動画をローカル環境で自動生成できる「AutoShorts」が公開されています。

divyaprakash0426/autoshorts: Automatically generate viral-ready vertical short clips from long-form gameplay footage using AI-powered scene analysis, GPU-accelerated rendering, and optional AI voiceovers.
https://github.com/divyaprakash0426/autoshorts

◆サンプル
作成される動画のサンプルです。


◆AutoShorts主な機能
・AIを活用したシーン解析機能
シーン解析にはOpenAIGoogle Geminiのいずれかを利用、動画内のシーンを7つのカテゴリーに自動的に判別し抽出します。

カテゴリー内容

action

戦闘シーン・緊迫した状況・ギリギリの攻防

funny

失敗シーン・バグ・予想外の面白いシーン・コミカルな状況

clutch

1対多の状況・逆転劇・土壇場での勝利

wtf

予期せぬ出来事・驚く瞬間・混乱状態

epic_fail

敗北につながる重大なミス

hype

祝福のシーン・最高潮の盛り上がり

skill

トリックショット・知的なプレイ・高度なテクニック・印象的なシーン


・字幕生成機能
OpenAIのWhisperを使用して音声から文字起こしが可能で、さらに音声が無い場合でもゲームプレイの内容に応じたキャプションをAIが生成。字幕スタイルも以下から選択できます。

スタイル内容

gaming

ゲーム向け

dramatic

劇的な演出表現

funny

面白さを強調する表現

minimal

シンプルな表現

genz

Z世代モード・スラングを多用

story_news

ストーリーモード・プロのeスポーツ実況アナウンサー

story_roast

ストーリーモード・皮肉交じりの辛辣なコメント

story_creepypasta

ストーリーモード・ホラー系、緊張感のあるナレーション

story_dramatic

ストーリーモード・壮大な映画風のナレーション

auto

自動判別によりスタイルを自動調整


PyCapsと連携することで字幕のテンプレートを選択できるほか、AIがカテゴリーに合わせてフォントを自動で変更したり、絵文字を追加したりすることも可能です。

・AIによるナレーション機能
音声生成エンジン:自然言語による説明文から独自の音声を生成する「Qwen3-TTS」を採用。
動的音声生成機能:AIがキャプションのスタイルと内容に基づいて自動的に音声キャラクターを生成。
スタイル適応型音声:各字幕スタイルには独自の音声プリセットを設定。
自然言語による指示:テキストプロンプトによって音声の特徴を定義可能。
超低遅延処理:flash-attentionにより推論処理を最適化し、超低遅延で音声を生成。
多言語対応:英語、中国語、日本語、韓国語など10言語以上に対応。
スマートミキシング:音声解説が再生される際にゲーム音声を自動的に減衰させる機能。

◆AutoShortsをインストール
今回はNVIDIAのGPUを搭載したWindows 11上でUbuntuがセットアップされたwsl2にインストールします。なお、NVIDIA Container Toolkitがインストールされている必要があります。プロジェクトをクローンし、autoshortsフォルダに移動します。

git clone https://github.com/divyaprakash0426/autoshorts.git
cd autoshorts


wsl2の場合「decord」のビルドで失敗するので、Dockerfileの10番目の工程をコメントアウトし「RUN pip install --no-cache-dir decord」を追加します。

# 10. Build Decord with CUDA support
#RUN git clone --recursive https://github.com/dmlc/decord && \
#    cd decord && \
#    mkdir build && cd build && \
#    cmake .. -DUSE_CUDA=ON -DCMAKE_BUILD_TYPE=Release \
#    -DCUDA_nvcuvid_LIBRARY=/usr/lib/x86_64-linux-gnu/libnvcuvid.so && \
#    make -j$(nproc) && \
#    cd ../python && \
#    python setup.py install && \
#    cd /app && rm -rf decord

RUN pip install --no-cache-dir decord


さらに「Verify installations」のRUNコマンドをコメントアウトします。

# Verify installations
#RUN python -c "import torch; import flash_attn;…"


Dockerコンテナをビルドします。

docker build -t autoshorts .


コンテナを起動します。

docker run -it --gpus all autoshorts bash


コンテナの中に入るので次のコマンドを実行するのですが、コマンドは環境により変わる可能性があります。

ln -sf /usr/lib/x86_64-linux-gnu/libnvcuvid.so.1 \
       /usr/lib/x86_64-linux-gnu/libnvcuvid.so

echo "/usr/lib/x86_64-linux-gnu" >> /etc/ld.so.conf.d/nvdec.conf
ldconfig

apt-get update
apt-get install -y --no-install-recommends \
  libavcodec-dev libavformat-dev libavutil-dev libavfilter-dev \
  libavdevice-dev libswresample-dev libswscale-dev pkg-config

cd /app
git clone --recursive https://github.com/dmlc/decord
cd decord
mkdir build && cd build

cmake .. -DUSE_CUDA=ON -DCMAKE_BUILD_TYPE=Release
make -j"$(nproc)"

cd ../python
python setup.py install

cp -f /app/decord/build/libdecord.so /usr/lib/x86_64-linux-gnu/
ldconfig


別のターミナルを立ち上げ、起動しているコンテナのIDを確認します。

docker ps


コンテナIDを指定して「autoshorts-fa」という名前のイメージを作成します。イメージが保存されたらpipを実行したコンテナからexitで抜けます。

docker commit "コンテナID" autoshorts-fa


「.env.example」を「.env」としてコピー。

cp .env.example .env


「.env」ファイルを編集して設定を行います。今回はGeminiを利用し日本語で字幕を出力させるため以下の箇所を変更しました。GeminiのAPIキーは取得したものに置き換えます。

AI_PROVIDER=gemini
GEMINI_API_KEY=your-gemini-api-key
GEMINI_MODEL=gemini-3-flash-preview
TTS_LANGUAGE=ja


「gameplay」フォルダを作成し、元になる動画を配置します。今回はフォートナイトのプレイ動画を用意しました。

mkdir gameplay


コンテナを起動しautoshortsを実行します。

docker run --rm \
    --gpus all \
    -v $(pwd)/gameplay:/app/gameplay \
    -v $(pwd)/generated:/app/generated \
    --env-file .env \
    autoshorts-fa \
    python run.py


生成されたクリップやログファイルは「generated」フォルダへ以下のように保存されます。

generated/
├── video_name scene-0.mp4          # Rendered short clip
├── video_name scene-0_sub.json     # Subtitle data
├── video_name scene-0.ffmpeg.log   # Render log
├── video_name scene-1.mp4
└── ...


作成されたショート動画を確認すると、元動画内の戦闘場面が上手く切り取られていました。字幕はエラーで入らなかったのですが、動きのある状況の切り取り動画が自動で作成されるだけでも十分便利です。


なお、海外掲示板のHacker Newsで作者のDivyaprakash氏は開発の動機について「既存のAIツールの多くは利用料が高いうえに動作も遅いことに不満がありました。自分のPCの性能を最大限に活かして、コマンド操作で軽快に動く開発者向けのツールを作りたかった」と述べています。

この記事のタイトルとURLをコピーする

・関連記事
無料で自前のフル機能搭載のYouTubeっぽい動画サイトを構築できる「MediaCMS」 - GIGAZINE

無料でオープンソースの動画編集アプリ「Kdenlive」レビュー、Windows・macOS・Linuxで動作可能 - GIGAZINE

AIエージェントがノード型に配置したタスクを実行して動画を編集するウェブアプリ「Mosaic」 - GIGAZINE

無料であらゆる動画の字幕を自動で文字起こし・修正・編集・翻訳ができるオープンソースの字幕エディター「Subtitle Edit」を使ってみた - GIGAZINE

xAIが動画生成AI「Grok Imagine 1.0」をリリース、GoogleのVeo 3.1を超える性能 - GIGAZINE

in ソフトウェア,   レビュー,   ゲーム, Posted by darkhorse_logmk

You can read the machine translated English article 'AutoShorts' automatically generates sho….