Microsoftが生成AI利用ガイドの例に「ハリー・ポッター」を使用していたことが話題になった直後に該当ページが削除される

Microsoftが公開している「Azure SQLデータベースに生成AIをどう組み込むか」を解説したガイドに、データをAIに理解させ検索して活用する例として「ハリー・ポッター」シリーズの内容が使用されていました。このガイドは2024年11月に公開されたものですが、「ハリー・ポッター」シリーズを用いた例が著作権侵害ではないかとソーシャルニュースサイトのHacker Newsで話題になった直後、該当するページが削除されています。
Microsoft offers guide to pirating Harry Potter series for LLM training | Hacker News
https://news.ycombinator.com/item?id=47067759
Microsoftが2024年11月19日に公開した「LangChain Integration for Vector Support for SQL-based AI applications」というページは記事作成時点で削除されていますが、インターネットアーカイブから閲覧することができます。
LangChain Integration for Vector Support for SQL-based AI applications - Azure SQL Devs’ Corner
https://archive.is/D9vEN
このページは、Microsoftのデータベース管理システムであるSQL Serverが、Azure SQLおよびMicrosoft FabricのSQLデータベースにおいてネイティブのベクトル検索機能をサポートするようになったことを告知するものです。従来のSQLデータベースは表形式のデータを正確に検索することに優れていた一方で、「ポジティブな文章を検索」というような意味ベースの検索は基本的にできませんでした。そんなSQLに、意味が近い文章を数学的な距離で探せる「ベクトル検索」が追加されたことで、専用のベクトルデータベース無しにSQLだけでデータベースの内容を管理しやすくなり、検索拡張生成(RAG)などのAIアプリケーション構築が容易になったというわけです。
その上で、「LangChain Integration for Vector Support for SQL-based AI applications」のページでは「LLMを使用して、わずか数行のコードで独自のアプリケーションに生成AI機能を追加する方法」をガイドしています。新たに公開された「langchain-sqlserver python」パッケージをインストールし、Azure Blobストレージからデータセットを読み込んだ上で入力トークンの制限をクリアするために小さなチャンクに分割したら、埋め込み生成とチャット完了のための関数を定義します。Vector Storeを初期化し、埋め込みとともにドキュメントをAzure SQLに挿入することで、類似性検索を実行できるようになります。
Microsoftはこの「ベクトル検索のサンプル」として、「ハリー・ポッターと賢者の石」を使用しました。Microsoftは「よく知られたデータセットを使用することで、多くの人に馴染みがあり、魅力的な例を作成することができます」と説明しています。実際に、「ハリー・ポッターと賢者の石」の内容を含むデータベースにベクトル検索を組み込むことで、「ハリーは最初に魔法使いだと知らされたときどう感じた?」といった意味や感情ベースの質問に回答できたり、「ハリー・ポッターと賢者の石」の世界をベースにした自分だけのストーリーを作り上げたりといった例をMicrosoftは示しています。

さらに同ページでは、「ハリー・ポッターと賢者の石」の内容から生成したAIによるビジュアルも掲載していました。

このMicrosoftのページは2024年11月19日に公開されたものですが、2026年2月19日にソーシャルニュースサイトのHacker Newsに取り上げられ、許諾の有無が説明されていない状態で「ハリー・ポッターと賢者の石」を生成AIに組み込んでガイドの例に使用している点や、AI生成の画像まで掲載している点について、著作権の問題が指摘されました。また、このような明らかに問題がある内容がそのまま公開されていたMicrosoftの姿勢にも疑問の声が挙がっています。
そして、Hacker Newsのスレッドが作られてから約2時間後、Microsoftが該当のページを削除したことが報告されました。「1年以上公開されっぱなしだった2024年の記事が、話題になったこのタイミングで削除されるのは、Microsoftの誰かがこのスレッドを見たのでしょうか?」など驚くコメントが多数寄せられています。
・関連記事
MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調 - GIGAZINE
MicrosoftとOpenAIが著作権侵害で新聞社8社から訴えられる - GIGAZINE
AIトレーニングについてコンテンツ作者に使用許可を求めるなら「国のAI産業が一夜で消滅してしまう」と元Meta幹部のニック・クレッグが語る - GIGAZINE
「AI企業が合法的に取得した書籍でAIをトレーニングするのに著者の許可は必要ない」という判決が下される - GIGAZINE
Metaがエロ動画をAIのトレーニングに使ったとアダルトサイトから訴えられるも「個人利用」だとして反論 - GIGAZINE
OpenAIは海賊版書籍のデータセットを削除した理由の説明を避けようとしている - GIGAZINE
・関連コンテンツ
in AI, Posted by log1e_dh
You can read the machine translated English article Microsoft's use of 'Harry Potter' as….







