ソフトウェア

ロシアの検索エンジンYandexが「ハゲ」と検索してもプーチン大統領の写真が出ないように検索結果をいじっていたことが判明

by Carmen Rodriguez

2023年1月に、「ロシアのGoogle」と呼ばれることもあるロシア最大の検索エンジン「Yandex」からソースコードが流出しました。このコードの解析により、Yandexは「ハゲ頭」や「うそつき」といった罵倒語で検索した際に、ウラジーミル・プーチン大統領の画像が表示されないようにしたり、「Z」で検索してもナチス・ドイツに関する検索結果などが表示されないようにしていたことが分かったことが報じられています。

Yandex scrapes Google and other SEO learnings from the source code leak
https://searchengineland.com/yandex-leak-learnings-392393

Yandex caught scraping Google SEO code | TechRadar
https://www.techradar.com/news/yandex-caught-scraping-google-seo-code

«Яндекс» блокировал изображения Путина, когда пользователи искали «бункерного деда». И нацистские символы — когда они искали Z Что «Медуза» узнала из новой утечки «Яндекса». Предупреждаем: много мата ???? — Meduza
https://meduza.io/feature/2023/01/30/yandeks-blokiroval-izobrazheniya-putina-kogda-polzovateli-iskali-bunkernogo-deda-i-natsistskie-simvoly-kogda-oni-iskali-z

Yandex Censors Search So ‘Bald F*cker’ and ‘Bunker Grandad’ Won’t Show Putin: Report
https://www.thedailybeast.com/yandex-censors-search-so-bald-fcker-and-bunker-grandad-wont-show-putin-report

Yandexからのソースコード流出は、ハッキングなどの攻撃ではなく、政治的動機を持つ元Yandex従業員がGitリポジトリを盗み出して公開したことにより発生しました。

Yandexの40GB超えの内部情報流出は「従業員が流出させた」という公式コメント、流出ファイル一覧もアリ - GIGAZINE


Yandexから流出したファイルは合計44.7GBに上るので解析には時間を要しますが、現段階でもYandexやYandexと人的交流が活発なGoogleの検索エンジンについて多くの知見が得られています。

例えば、SEO関連ニュースなどを扱うSearch Engine Landの解析によると、当初1922あるとされていたランキング要素はごく一部に過ぎず、実際には1万7854ものランキング要素があったとのこと。その中には「NEWS_AGENCY_RATING」という、Yandexが特定の報道機関を有利にするために使われているとおぼしき変数もありました。

この発見についてSearch Engine Landは「このようなバイアスをランキングシステムに導入しないことを断固として表明してきたGoogleとは大きく異なる点です」と述べています。


さらに、ロシア当局から「好ましくない組織」に認定されているロシア語のニュースサイト・Meduzaの解析により、Yandexがプーチン大統領を不都合な検索ワードと結びつけないようにしていたことも分かりました。

Yandexによる検索クエリの自動修正は、主にポルノ画像や動画を削除することを目的に使われていましたが、この仕組みは特定の検索ワードからプーチン大統領の画像を出力しないようにする用途にも使われていたとのこと。

プーチン大統領の画像が表示されないように修正されていた検索ワードは以下の通り。
пиздабол(うそつき)
плешивый(ハゲ頭)
хуйло/хуйла/хуйлы/хуило/хуила(くそ。「プーチン・フイロ!」としてプーチン大統領を非難する際に使われた下品な言葉)
・бункерный дед(塹壕(ざんごう)おじさん。ロシアの野党政治家・アレクセイ・ナワリヌイ氏などが使用するプーチン大統領の侮辱的ニックネーム)
・главный вор(大泥棒)
・гондон всея руси(全ルーシのコンドーム)
・хуй в скафандре(宇宙服を着たペニス)
・xуйло в проруби(氷の穴の中のくそ)
・как выглядят педофилы(小児性愛者の見た目)
・когда он сдохнет(彼はいつ死ぬのか)
・странное создание машет рукой(手を振る奇妙な生き物)

また、同様にアルファベットの「Z」も好ましくない検索結果、特にナチズムに関するものと同時にヒットしないようにされていました。「Z」はロシア語では使わない文字ですが、2022年2月のウクライナ侵攻以降は戦争のシンボルとして用いられています。

ロシアで戦争のシンボルとなった「Z」とはどういう意味なのか? - GIGAZINE


Yandex広報担当者は、ソースコード流出について問い合わせた海外メディアのThe Daily Beastに対し、「流出したコードは古く、当社のサービスで現在使用されているバージョンとは異なり、公開されたものの一部は実際には使用されていませんでした」と話しました。

この記事のタイトルとURLをコピーする

・関連記事
ロシア最大の検索エンジン「Yandex」のソースコード流出で検索ランキングの決定要因が明らかに - GIGAZINE

Yandexの40GB超えの内部情報流出は「従業員が流出させた」という公式コメント、流出ファイル一覧もアリ - GIGAZINE

ロシアのGoogleこと「Yandex」の40GB超のGitリポジトリが漏えい - GIGAZINE

「ロシアのGoogle」とも言われるITの巨人「Yandex」が危機 - GIGAZINE

Firefoxからロシア製検索エンジン「Yandex」で一発検索する機能が削除される - GIGAZINE

in ソフトウェア, Posted by log1l_ks

You can read the machine translated English article here.