如何設定robots.txt

robots.txt 樣本:
例:設定所有 robot 不能夠收集 /tmp/ 和 /download/ 目錄中的資料。

User-agent: *
Disallow: /tmp/
Disallow: /download/

例:設定所有 robot 不能夠收集 etc.htm 和 /index/work.html 中的資料。

User-agent: *
Disallow: /etc.htm
Disallow: /index/work.html

例:設定所有 robot 不能夠收集所有網頁資料。

User-agent: *
Disallow: /

例:設定 Google 不能夠收集 /tmp/ 目錄中的資料。

User-agent: Googlebot
Disallow: /tmp/

例:設定 Google 和 Excite 不能夠收集 /tmp/ 和 /index/work.html 目錄中的資料。

User-agent: Googlebot
User-agent: ArchitextSpider
Disallow: /tmp/
Disallow: /index/work.html

User-agent的相關資料

搜尋引擎 -Robot 名稱
AltaVista- Scooter
Infoseek -Infoseek
Hotbot -Slurp
AOL Search -Slurp
Excite -ArchitextSpider
Google -Googlebot
Goto -Slurp
Lycos -Lycos
MSN -Slurp
Netscape -Googlebot
NorthernLight -Gulliver
WebCrawler -ArchitextSpider
Iwon -Slurp
Fast -Fast
DirectHit -Grabber
Yahoo Web Pages -Googlebot
Looksmart Web Pages -Slurp

然後將檔案上傳到網站目錄就可以了。

沒有留言: