robots.txtとは？意味・使い方を解説 | Creative Drive | 顧客育成に強い唯一のAIライティングツール

GLOSSARY

robots.txt

用語解説

robots.txtとは、ウェブサイトのルートディレクトリに置かれるテキストファイルで、クローラー（Googlebotなど）に対してアクセスを許可・禁止するURLのルールを指定するファイルです。

クロールを「許可・禁止」するものであり、インデックスをコントロールするものではありません。robots.txtでブロックされたページはクロールされませんが、外部サイトからリンクされていればURLがインデックスに残ることがあります（インデックスを防ぐにはnoindexが必要）。

WordPressの `/wp-admin/` など管理画面URLをrobots.txtでブロックし、クロールバジェットの無駄遣いを防ぎます。セキュリティ上の理由でも不要なURLはブロックすることが推奨されます。

ECサイトやブログで `?sort=` `?page=` などのパラメータURLが大量に生成される場合、robots.txtでブロックして重複クロールを防ぎます。

robots.txtはクロールのブロックですが、外部リンクがあるページはインデックスに残ることがあります。インデックスを防ぐにはnoindexタグの使用が確実です。

CMSの更新・新機能追加・URLの再設計のたびに見直しが必要です。誤って重要ページをブロックしていないか定期確認してください。

以下に当てはまる場合はrobots.txtの確認が必要です。

Creative Drive AIエージェントプラン

コンテンツマーケティングを、AIが月最大100記事・全自動で実行

競合データ×顧客行動データをリアルタイムで掛け合わせ、担当者の工数ほぼゼロで問い合わせを増やし続けます。ChatGPT・Perplexityへの引用最適化（AIO/LLMO）にも対応。