tellogs.com

robots.txtジェネレーターの参考資料・仕様

robots.txtジェネレーター

robots.txtの仕様はGoogle Developersのドキュメントに詳細に記述されています。主要なディレクティブには、User-agent(対象のクローラーを指定)、Disallow(クロールを禁止するパス)、Allow(クロールを許可するパス)、Sitemap(サイトマップのURLを指定)があります。これらのディレクティブを組み合わせることで、クローラーの行動を細かく制御できます。

User-agentディレクティブでは、アスタリスク(*)ですべてのクローラーを指定できます。特定のクローラーのみを対象にする場合は、GooglebotやBingbotなどクローラー名を指定します。Disallowディレクティブにパスを指定すると、そのパス以下のページがクロール対象外になります。空のDisallowフィールドはすべてのページを許可することを意味します。

パターンマッチングでは、アスタリスク(*)で任意の文字列を、ドル記号($)でURL末尾を表現できます。例えば、「.jpg$」はすべてのJPEGファイルを指定します。robots.txtの仕様を正しく理解し、このジェネレーターで適切なファイルを作成しましょう。Google Search Consoleでのテストを習慣化することも重要です。

robots.txtジェネレーターを使ってみましょう

このページの内容を、robots.txtジェネレーターで実際に試してみましょう。

robots.txtジェネレーターを開く