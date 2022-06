Googleは検索結果に表示するウェブサイトの情報を収集するために、ネット上に公開されている無数のウェブページの情報を「 Googlebot 」と呼ばれるクローラで収集しています。このGooglebotに関する 公式ドキュメント(英語版) には「15MB以上のファイルをクロールする際は、先頭15MBまでしかクロールしない」という記載が含まれているのですが、この15MB制限の詳細についての解説が新たに公開されました。 Googlebot and the 15 MB thing | Google Search Central Blog | Google Developers https://developers.google.com/search/blog/2022/06/googlebot-15mb GoogleはGooglebotを用いて日々増え続けるネット上の膨大な数のウェブページをクロールしています。Googleはウェブサイトの管理者向けにGooglebotの仕様をまとめたドキュメントを公開しているのですが、このドキュメントに加わった「Googlebotは1ファイルにつき最大15MBまでしかクロールしない」という記述に関して多くの問い合わせが寄せられたとのこと。そこで、GoogleはGooglebotの15MB制限の詳細についての解説を新たに公開しました。 ◆「15MB」とはウェブページのどの部分のサイズを示しているのか Googlebotはページ上に読み込まれる全コンテンツではなく、ページのソースのみをクロールしています。15MBという制限はHTMLファイルなどの「対象ページのURLにアクセスした際に最初に読み込まれるファイル」を対象としたもので、ページ上に表示される画像やムービーといったコンテンツの合計サイズが15MBを超えた場合でも、HTMLファイルなどのサイズが15MBを超えていなければ15MB制限の対象にはなりません。 ◆15MB制限はウェブサイトの管理者にどんな影響をもたらすのか Googleによると、インターネット上に存在するHTMLファイルのサイズの中央値は30KBとのこと。このため、ほとんどのウェブサイトの管理者は15MB制限を気にする必要はありません。GoogleはHTMLファイルが15MBを超えているウェブサイトの管理者に対して、スクリプトを外部ファイルに移動するように推奨しています。

・関連記事

Googlebotの各種統計情報「クロール統計レポート」が改善される、より詳細な情報が取得可能に - GIGAZINE



Googleの検索結果に表示される広告はどれくらいの効果があるのか? - GIGAZINE



Googleが6割以上のページのタイトルを勝手に書き換えて検索結果に表示、長すぎても短すぎてもダメ - GIGAZINE



知っていると便利なGoogle検索の隠れた27機能 - GIGAZINE



Google検索で「上手にググる」ための5つのポイントをソフトウェア工学の専門家が解説 - GIGAZINE



2022年06月29日 16時00分00秒 in ネットサービス, Posted by log1o_hf

You can read the machine translated English article here.