Robots.txt: Difference between revisions

From LemonWiki共筆
Jump to navigation Jump to search
No edit summary
No edit summary
 
(17 intermediate revisions by 2 users not shown)
Line 1: Line 1:
* [http://www.searchengineworld.com/cgi-bin/robotcheck.cgi Robots.txt Validator]
== Robots.txt for golbal website or specific folders ==
manual
* [http://www.robotstxt.org/wc/norobots.html A Standard for Robot Exclusion]
* [http://www.searchtools.com/robots/robots-meta.html Search Indexing Robots and the Robots META Tag - SearchTools.com]
* [http://www.google.com/support/webmasters/bin/answer.py?answer=40367 網站管理員說明中心 - 我不想將要攔截的每個檔案都列出。我可以使用* 和 $ 模式媒合嗎?]([http://www.google.com/support/webmasters/bin/answer.py?answer=40367&hl=en EN])
* [http://www.google.com/support/webmasters/bin/answer.py?answer=40367 網站管理員說明中心 - 我不想將要攔截的每個檔案都列出。我可以使用* 和 $ 模式媒合嗎?]([http://www.google.com/support/webmasters/bin/answer.py?answer=40367&hl=en EN])
* [http://www.google.com.tw/intl/zh-TW/webmasters/remove.html#outdated 給網站管理員的 Google 資訊]
* [http://www.mediawiki.org/wiki/Robots.txt Robots.txt - MediaWiki]
: [http://www.google.com/webmasters/remove.html Google Information for Webmasters] (last visited: February 10, 2006)
* [http://code.google.com/web/controlcrawlindex/docs/getting_started.html Getting Started - Controlling Crawling and Indexing - Google Code]


[[Category:Web_Dev]]
 
robots.txt validator
* [http://tool.motoricerca.info/robots-checker.phtml New Robots.txt Syntax Checker: a validator for robots.txt files]
 
== sitemap ==
 
Sitemap: URL_of_sitemap_file
 
[[Google Sitemap Template for MovableType]]
 
 
== 移除自己的網頁在google上的索引 ==
不希望自己的網站或網頁在google上被搜尋 要求Google移掉連結
* ?天: 使用[http://services.google.com/urlconsole/controller 自動網址移除系統]
* 3-5個工作天
** 3-5個工作天內生效,並排除索引至少90天: 使用 [https://www.google.com/webmasters/tools/ Google 網站管理員工具]中的 URL 移除要求工具 ([http://www.google.com.tw/support/webmasters/bin/answer.py?answer=61062&ctx=sibling 說明])
** 3-5個工作天: [http://www.google.com.tw/support/bin/request.py?ctx=answer 說明中心]回報選「法務問題」 via [http://khchao.blogspot.com/2007/12/google.html 威爺喔北貢: 移除Google搜尋引擎上的資料以及庫存網頁]
* 6~8週內生效,並暫時排除索引180天: 使用robots.txt等 (說明: [http://www.google.com.tw/support/webmasters/bin/answer.py?answer=59819&topic=8459 如何確定我的內容可以從 Google 索引移除?], [http://www.google.com/intl/zh-TW/remove.html])
: more on [http://www.google.com.tw/support/webmasters/bin/answer.py?answer=35301 網站管理員說明中心 - 我如何從 Google 的索引中移除內容?]
 
=== meta tag for single webpage ===
 
<meta name="robots" content="noindex,nofollow" />
 
 
related:
* 2007/10事件: [http://www.wretch.cc/blog/billypan101&article_id=11714886 BillyPan 的部落格 - 無名刪掉robots.txt,【無名,別擋Google!】串聯初步成功。宣告停止串聯。]
* [http://www.robotstxt.org/wc/meta-user.html HTML Author's Guide to the Robots META tag]
* [[Add meta tag to movabletype]]
* [http://www.robbin.cc/vb/showthread.php?t=485 如何用.htaccess擋搜尋器 - WordPress歡樂正體中文交流所]
* [http://gordon168.tw/?p=202 用Robots.txt來和搜尋機器人打交道 « 高登工作室]
* [http://www.freegroup.org/2012/08/how-to-remove-results-from-google-yahoo-facebook/  [教學] 當個人隱私資料(電話號碼、地址)出現在 Google、Yahoo 頁庫存檔或 Facebook 時,如何請求刪除?]
 
[[Category:Web_Dev]] [[Category:Google]]

Latest revision as of 13:59, 21 September 2012

Robots.txt for golbal website or specific folders[edit]

manual


robots.txt validator

sitemap[edit]

Sitemap: URL_of_sitemap_file

Google Sitemap Template for MovableType


移除自己的網頁在google上的索引[edit]

不希望自己的網站或網頁在google上被搜尋 要求Google移掉連結

more on 網站管理員說明中心 - 我如何從 Google 的索引中移除內容?

meta tag for single webpage[edit]

<meta name="robots" content="noindex,nofollow" />


related: