ソフトウェア

AI学習にYouTubeの字幕を使用したとの報道にAppleが「Apple Intelligence」を含む製品版AIには使っていないと反論


非営利の研究団体が作成したAI学習用のデータセット「The Pile」にYouTubeの字幕が含まれていたことを受け、このデータセットを使用したとされるAppleやNVIDIAが非難されました。これに対し、Appleは「研究用の言語モデルに使用したが、AppleのAI機能であるApple Intelligenceには使用していない」と反論しました。

Apple says its OpenELM model doesn't power Apple Intelligence amid YouTube controversy - 9to5Mac
https://9to5mac.com/2024/07/17/apple-intelligence-openelm-training-youtube/


2024年7月16日にIT系メディアのProof Newsが報じたところによると、非営利AI研究団体のEleutherAIが作成したデータセット「The Pile」に、欧州議会の資料や英語版Wikipediaの文章、17万本を超えるYouTube動画の字幕などが含まれていたとのこと。Proof Newsは研究論文や公開情報を調査して、AppleやNVIDIA、Bloomberg、AI開発企業のAnthropicなどが「The Pile」を使用していたと指摘しました。

Apple・NVIDIA・AnthropicなどがYouTubeの動画字幕を許可なくAIのトレーニングに利用していたと判明 - GIGAZINE


特にAppleは「Apple Intelligence」というAI機能を発表したばかりだったため、不適切なデータを取り入れたのではないかと疑われましたが、後にAppleが「当該データセットは研究用の言語モデルにのみ使用し、Apple Intelligenceを含むAIのいずれにも影響は与えなかった」と反論しました。

Appleは研究用の大規模言語モデルである「OpenELM」を構築しており、その(PDFファイル)研究論文の中で「The Pileを使用した」と明記しています。これについてAppleは「研究コミュニティに貢献し、オープンソースの大規模言語モデル開発を促進することを目的としてOpenELMモデルを作成しており、Apple Intelligenceのためではない」と説明し、該当データセットについてはあくまで研究目的で使用したものであり、Apple Intelligenceには使用していないと強調しました。また、AppleはOpenELMモデルの新バージョンを構築する予定はないとも伝えています。

この記事のタイトルとURLをコピーする

・関連記事
AppleがアシスタントAI「Apple Intelligence」の性能を示すベンチマーク結果を公開、GPT-4-Turboとの性能差も明らかに - GIGAZINE

Appleが新たなパーソナルAIの「Apple Intelligence」を発表、OpenAIとの提携でSiriがChatGPTをサポート - GIGAZINE

AppleがWWDC24で発表した「Apple Intelligence」や「iPhoneミラーリング」などは2024年内はEUでリリースされない - GIGAZINE

Appleは今秋にGoogleのチャットボット・GeminiをApple Intelligenceに統合するとのウワサ - GIGAZINE

in ソフトウェア, Posted by log1p_kr

You can read the machine translated English article here.