Appleは新しいSiriを動かすためにGeminiを小型化してiPhoneに詰め込む作業を進めている

Appleは間もなく「完全に再構築されたSiri」を発表すると目されています。この新しいSiriのために、AppleはGoogleの生成AIであるGeminiを使う複数年契約を締結しているのですが、AppleはこのGeminiをiPhone上で動かすために小型化しようとしているとThe Informationが報じました。
Apple to Renew Push for AI That Runs on Devices, Instead of the Cloud — The Information
https://www.theinformation.com/articles/apple-renew-push-ai-runs-devices-instead-cloud
Apple working to cram massive Gemini model into iPhone to power new Siri - Ars Technica
https://arstechnica.com/ai/2026/05/apple-reportedly-trying-to-distill-googles-multi-trillion-parameter-gemini-ai-to-run-on-iphone/
AppleはこれまでAIをデバイス上で実行することでプライバシー保護につながると長らくうたってきました。AppleはGeminiについても小型化を目論んでいますが、完全にデバイス上だけで処理することは難しいため、クラウドサーバー上での処理を必要とする模様。Gemini搭載版のSiriはデバイス上とクラウド上の両方で実行されるため、Appleがこれまでこだわってきた「プライバシー保護のためのローカルAIへのこだわり」とは反するものです。
最新チップが発表されるたび、チップがAI向けに最適化されていることが大々的にアピールされています。AppleもAppleシリコンにおいて、AIや機械学習の処理に特化した専用プロセッサNPUである「Neural Engine」のアップグレードをアピールしています。そのため、スマートフォン上で高性能なAIモデルを処理できると思われがちです。しかし、ほとんどのスマートフォンのGPUはAIに特化したNPUよりも多くのAIトークンを処理することが可能。これに対して、Neural EngineのようなNPUは文脈に応じた効率的なAI処理のために設計されたものであり、デバイス上でのAI処理速度を速くすることができても、巨大なAIモデルをメモリに保持するだけのメモリ(RAM)は備えていません。
スマートフォン上で動作するAIモデルは非常に小型で、パラメーター数はせいぜい数十億個程度です。これに対して、Googleの最新のGeminiは数兆個のパラメーターを持っているため、iPhone上で直接動かすにはあまりにも巨大です。また、デバイス上のAIモデルは低精度で動作するよう量子化されているため、処理速度は速くなるもののトークン生成の精度に影響が出ます。これらの要素が重なるため、クラウドベースのAIと比べるとスマートフォン上で直接動作するAIは、時にまぬけな出力を行ってしまうことがあるというわけ。

Googleはモバイルデバイス向けに最適化されたGemini Nanoを提供しています。しかし、Gemini NanoはMagic Cueや音声要約といったコンテキスト機能を実現するために設計されたものです。これに対して、Siriは対話型アシスタントであり、話しかけるとさまざまな処理を実行します。これは全く異なる体験で、異なるAIモデルが必要になるとテクノロジーメディアのArs Technicaは指摘しました。なお、GoogleのAndroidはAIモデルをローカルで処理しておらず、Geminiとの会話は常にクラウドに送信されます。
報道によると、AppleはGoogleとの契約締結後から、Geminiの最適化に着手しているそうです。この最適化とは、「リソース消費の少ない小型AIモデルが大規模で高価なAIモデルを模倣するように学習するプロセス」であるとArs Technicaは説明しています。十分な時間をかければ重要な機能を確実に移転しつつ、AIモデルから重要度の低い要素を削除することができます。これにより、Siriは一部のタスクをローカルコンピューティングで処理できるようになるかもしれませんが、「クラウドコンポーネントの導入は避けられないだろう」とThe Informationは報じました。
AppleはパーソナルAIのApple Intelligence向けに、プライバシー保護にも注力したAI処理実行サーバーの「Private Cloud Compute」を運用しています。しかし、このPrivate Cloud Compute上でGoogleの巨大なGeminiを動作させることは、困難を極めているとThe Informationは報じています。
AppleのアシスタントAI「Apple Intelligence」に使われるAI処理サーバー「Private Cloud Compute」の安全性への取り組みをAppleが説明 - GIGAZINE

なお、新しいSiriの処理がAppleのPrivate Cloud Compute以外のサーバー上で行われることになるのではないかということは、以前から報じられていました。
新しいSiriのチャットボットはAppleではなくGoogleのサーバーで実行される可能性がある - GIGAZINE

報道によると、GeminiはGoogleのサーバー上で動作するわけではなく、AppleはGeminiを実行するためにNVIDIAのコンフィデンシャル コンピューティングを使用する契約を締結したそうです。NVIDIAのコンフィデンシャル コンピューティングは、クラウド上で処理される間、GPU上のデータを暗号化したまま保持するため、Appleはユーザーのプライバシーへの配慮を依然として重視していると主張することができます。
なお、Appleは年次開発者向け会議のWWDC26を2026年6月8日から開催予定で、この中で新しいSiriを含むさまざまな新機能や新OSを発表すると目されています。
Appleの年次開発者向け会議「WWDC26」が2026年6月8日の週に開催決定、基調講演は6月8日に実施 - GIGAZINE

・関連記事
Appleの新しいSiriアプリにはチャットの自動削除機能が搭載される予定 - GIGAZINE
iOS 27の「完全に再構築されたSiri」は一体どんなものになるのか?単体アプリになって複数アプリ間でタスクを横断できるAIエージェントに進化 - GIGAZINE
Appleが「Siri」を音声アシスタントからAIエージェントへ刷新へ、単独の「Siri」アプリも - GIGAZINE
新しいSiriのチャットボットはAppleではなくGoogleのサーバーで実行される可能性がある - GIGAZINE
・関連コンテンツ
in AI, ソフトウェア, スマホ, Posted by logu_ii
You can read the machine translated English article Apple is working on miniaturizing the Ge….






