PCでクリック操作やタスク実行などができるAIモデル「Holo3」リリース、オープンソース版は無料枠あり

PCでクリック操作やタスク実行などができるAIモデル「Holo3」を、フランスのAIスタートアップであるH Companyが2026年3月31日に公開しました。Holo3はGUIエージェント向けに最適化された大規模ビジョン言語モデルで、オープンソース版の「Holo3-35B-A3B」はAIモデルの公開・配布サービスであるHugging Faceから無料で利用することができます。
Holo3 - H Company
https://hcompany.ai/holo3

Hcompany/Holo3-35B-A3B - Hugging Face
https://huggingface.co/Hcompany/Holo3-35B-A3B
Holo3はウェブ、デスクトップ、モバイルといったデジタル環境で動作する大規模ビジョン言語モデルです。画面上の情報を読み取り、ボタンを押したりフォームを埋めたりしながら、状況に応じた操作を実行するよう設計されています。
例えば、PDFファイルから機材の価格情報を取り出し、各従業員の残り予算と照合した上で、承認または却下のメールを各人に送るような複数アプリ連携の処理も想定されています。単にクリックするだけではなく、PDFファイル、表計算、メールをまたぎながら、文書の読み取りや計算、複数アプリ間での情報の受け渡しを行い、途中の状況を保ったまま作業を続ける処理まで含まれます。
今回公開されているオープンソース版の「Holo3-35B-A3B」は「Qwen/Qwen3.5-35B-A3B」をベースにファインチューニングされたモデルです。複数の処理部分のうち一部だけを使って動かすMixture of Experts構成が採用され、総パラメーター数は350億個、そのうち動作時に使われるアクティブパラメーター数は30億個です。画像とテキストを入力してテキストを生成するマルチモーダルAIとなっています。
学習にはオープンソースのデータセットに加え、AI用に人工的に作った大量の操作データや、人が内容を確認して注釈を付けた学習データが使われています。こうしたデータを組み合わせることで、画面の内容を見分ける力や次の操作を判断する力を強化しているとのこと。さらに、人工的に作った操作データを使うだけでなく、学習に使っていない場面にも対応しやすくなるよう訓練され、厳選した強化学習も組み合わされています。
企業向けシステムに近いUIや操作環境をコード生成エージェントで自動的に作る仕組み「Synthetic Environment Factory」も用意されており、Holo3はこうした学習用環境の中で業務に近い操作を学習しています。

性能面ではオープンソース版のHolo3-35B-A3Bが国際標準ベンチマーク「OSWorld-Verified」で77.8%を記録しています。さらに、上位モデルのHolo3-122B-A10Bは同じベンチマークで78.85%を記録しています。なお、Holo3-122B-A10Bの総パラメーター数は1220億個で、動作時に使うアクティブパラメーター数は100億個です。
複数の手順を順番にこなす486件の課題も用意されており、Eコマース、業務ソフト、コラボレーション、複数アプリ連携の4分野で評価が行われています。1つのアプリの中で完結する比較的短い操作から、複数のアプリをまたいで進める長めのワークフローまで含むこの独自ベンチマークは、「H Corporate Benchmark」と名付けられています。

H Companyによると、無料枠ではオープンソース版のHolo3-35B-A3BをAPI経由で試すことができ、レート制限は1分あたり10リクエストとのこと。上位モデルのHolo3-122B-A10Bは有料枠限定となっています。
・関連記事
Ai2がビジュアルウェブAIエージェントの「MolmoWeb」をリリース、HTMLを解析するのではなくブラウザのスクリーンショットで動作 - GIGAZINE
1100万時間の動画で学習したPC操作AI「FDM-1」が登場、動画の学習方法を根本から見直して2時間の動画を100万トークンに圧縮可能&自動運転車にも応用できる - GIGAZINE
スマホ自動操作AI「MAI-UI」が登場、Gemini 3 Proより上手にスマホを操作できてオープンソース版もあり - GIGAZINE
無料でWindows・macOSのファイルやブラウザを内蔵ローカルAIを使いAPIキー不要で自動操作できる「Accomplish」、OpenAIやAnthropicなどの外部AIも利用可能 - GIGAZINE
・関連コンテンツ
in AI, Posted by log1b_ok
You can read the machine translated English article AI model 'Holo3' capable of performing c….







