亚洲精品视频一区二区,一级毛片在线观看视频,久久国产a,狠狠狠色丁香婷婷综合久久五月,天天做天天欢摸夜夜摸狠狠摸

<sub id="tg2ci"></sub>

<rt id="tg2ci"></rt>

<center id="tg2ci"></center><style id="tg2ci"><del id="tg2ci"></del></style>

客服

網(wǎng)站建設、網(wǎng)絡(luò )營(yíng)銷(xiāo)、托管——劍鋒所指,所向披靡 (手機/微信：)

首頁(yè)

網(wǎng)站建設

全網(wǎng)營(yíng)銷(xiāo)

競價(jià)托管

新聞營(yíng)銷(xiāo)

網(wǎng)站托管

劍鋒服務(wù)

成功案例

聯(lián)系我們

關(guān)于我們

在線(xiàn)咨詢(xún)

在線(xiàn)客服與您一對一交流

當前位置: 主頁(yè) > 行業(yè)新聞 > seo >

robots.txt文件詳細解說(shuō),禁止搜索引擎收錄的方法

來(lái)源：未知日期：2017-06-29 | 分類(lèi)：seo

robots

1. 什么是robots.txt文件?

搜索引擎使用spider程序自動(dòng)訪(fǎng)問(wèn)互聯(lián)網(wǎng)上的網(wǎng)頁(yè)并獲取網(wǎng)頁(yè)信息。spider在訪(fǎng)問(wèn)一個(gè)網(wǎng)站時(shí)，會(huì )首先會(huì )檢查該網(wǎng)站的根域下是否有一個(gè)叫做 robots.txt的純文本文件，這個(gè)文件用于指定spider在您網(wǎng)站上的抓取范圍。您可以在您的網(wǎng)站中創(chuàng )建一個(gè)robots.txt，在文件中聲明該網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。
請注意，僅當您的網(wǎng)站包含不希望被搜索引擎收錄的內容時(shí)，才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內容，請勿建立robots.txt文件。西安專(zhuān)業(yè)做網(wǎng)站公司,網(wǎng)站制作公司推薦閱讀>>> 怎樣寫(xiě)robots文件_robots文件寫(xiě)法技巧_robot.txt的例子,

2. robots.txt文件放在哪里?

robots.txt 文件應該放置在網(wǎng)站根目錄下。舉例來(lái)說(shuō)，當spider訪(fǎng)問(wèn)一個(gè)網(wǎng)站（比如 http://www.abc.com）時(shí)，首先會(huì )檢查該網(wǎng)站中是否存在 http://www.abc.com/robots.txt這個(gè)文件，如果 Spider找到這個(gè)文件，它就會(huì )根據這個(gè)文件的內容，來(lái)確定它訪(fǎng)問(wèn)權限的范圍。

網(wǎng)站 URL 相應的 robots.txt的 URL

http://www.w3.org/ http://www.w3.org/robots.txt

http://www.w3.org:80/ http://www.w3.org:80/robots.txt

http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt

http://w3.org/ http://w3.org/robots.txt

3. 我在robots.txt中設置了禁止百度收錄我網(wǎng)站的內容，為何還出現在百度搜索結果中？

如果其他網(wǎng)站鏈接了您robots.txt文件中設置的禁止收錄的網(wǎng)頁(yè)，那么這些網(wǎng)頁(yè)仍然可能會(huì )出現在百度的搜索結果中，但您的網(wǎng)頁(yè)上的內容不會(huì )被抓取、建入索引和顯示，百度搜索結果中展示的僅是其他網(wǎng)站對您相關(guān)網(wǎng)頁(yè)的描述。

4. 禁止搜索引擎跟蹤網(wǎng)頁(yè)的鏈接，而只對網(wǎng)頁(yè)建索引

如果您不想搜索引擎追蹤此網(wǎng)頁(yè)上的鏈接，且不傳遞鏈接的權重，請將此元標記置入網(wǎng)頁(yè)的<HEAD> 部分：
<meta name="robots" content="nofollow">
如果您不想百度追蹤某一條特定鏈接，百度還支持更精確的控制，請將此標記直接寫(xiě)在某條鏈接上：
<a href="signin.php" rel="nofollow">signin</a>
要允許其他搜索引擎跟蹤，但僅防止百度跟蹤您網(wǎng)頁(yè)的鏈接，請將此元標記置入網(wǎng)頁(yè)的<HEAD> 部分：
<meta name="Baiduspider" content="nofollow">

5. 禁止搜索引擎在搜索結果中顯示網(wǎng)頁(yè)快照，而只對網(wǎng)頁(yè)建索引

要防止所有搜索引擎顯示您網(wǎng)站的快照，請將此元標記置入網(wǎng)頁(yè)的<HEAD>部分：
<meta name="robots" content="noarchive">
要允許其他搜索引擎顯示快照，但僅防止百度顯示，請使用以下標記：
<meta name="Baiduspider" content="noarchive">
注：此標記只是禁止百度顯示該網(wǎng)頁(yè)的快照，百度會(huì )繼續為網(wǎng)頁(yè)建索引，并在搜索結果中顯示網(wǎng)頁(yè)摘要。 西安網(wǎng)站建設需要多少錢(qián),西安網(wǎng)站建設推薦閱讀>>> robots.txt文件的重要作用意義,

6. 我想禁止百度圖片搜索收錄某些圖片，該如何設置？

禁止Baiduspider抓取網(wǎng)站上所有圖片、禁止或允許Baiduspider抓取網(wǎng)站上的某種特定格式的圖片文件可以通過(guò)設置robots實(shí)現，請參考“robots.txt文件用法舉例”中的例10、11、12。

7. robots.txt文件的格式

"robots.txt"文件包含一條或更多的記錄，這些記錄通過(guò)空行分開(kāi)（以CR,CR/NL, or NL作為結束符），每一條記錄的格式如下所示：

"<field>:<optional space><value><optionalspace>"

在該文件中可以使用#進(jìn)行注解，具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開(kāi)始，后面加上若干Disallow和Allow行,詳細情況如下：

User-agent:

該項的值用于描述搜索引擎robot的名字。在"robots.txt"文件中，如果有多條User-agent記錄說(shuō)明有多個(gè)robot會(huì ) 受到"robots.txt"的限制，對該文件來(lái)說(shuō)，至少要有一條User-agent記錄。如果該項的值設為*，則對任何robot均有效，在"robots.txt"文件中，"User-agent:*"這樣的記錄只能有一條。如果在"robots.txt"文件中，加入"User- agent:SomeBot"和若干Disallow、Allow行，那么名為"SomeBot"只受到"User- agent:SomeBot"后面的 Disallow和Allow行的限制。

Disallow:

該項的值用于描述不希望被訪(fǎng)問(wèn)的一組URL，這個(gè)值可以是一條完整的路徑，也可以是路徑的非空前綴，以Disallow項的值開(kāi)頭的URL不會(huì ) 被 robot訪(fǎng)問(wèn)。例如"Disallow:/help"禁止robot訪(fǎng)問(wèn)/help.html、/helpabc.html、 /help /index.html，而"Disallow:/help/"則允許robot訪(fǎng)問(wèn)/help.html、/helpabc.html，不能訪(fǎng)問(wèn) /help/index.html。"Disallow:"說(shuō)明允許robot訪(fǎng)問(wèn)該網(wǎng)站的所有url，在"/robots.txt"文件中，至少要有一條Disallow記錄。如果"/robots.txt"不存在或者為空文件，則對于所有的搜索引擎robot，該網(wǎng)站都是開(kāi)放的。西安制做網(wǎng)站公司,西安建站公司推薦閱讀>>> 谷歌針對智能手機推出的新型Googlebot,

Allow:

該項的值用于描述希望被訪(fǎng)問(wèn)的一組URL，與Disallow項相似，這個(gè)值可以是一條完整的路徑，也可以是路徑的前綴，以Allow項的值開(kāi)頭的 URL 是允許robot訪(fǎng)問(wèn)的。例如"Allow:/hibaidu"允許robot訪(fǎng)問(wèn)/hibaidu.htm、 /hibaiducom.html、 /hibaidu/com.html。一個(gè)網(wǎng)站的所有URL默認是Allow的，所以Allow通常與 Disallow搭配使用，實(shí)現允許訪(fǎng)問(wèn)一部分網(wǎng)頁(yè)同時(shí)禁止訪(fǎng)問(wèn)其它所有URL的功能。

使用"*"and"$"：
Baiduspider支持使用通配符"*"和"$"來(lái)模糊匹配url。
"$" 匹配行結束符。
"*" 匹配0或多個(gè)任意字符。

注：我們會(huì )嚴格遵守robots的相關(guān)協(xié)議，請注意區分您不想被抓取或收錄的目錄的大小寫(xiě)，我們會(huì )對robots中所寫(xiě)的文件和您不想被抓取和收錄的目錄做精確匹配，否則robots協(xié)議無(wú)法生效。

8. URL匹配舉例

Allow或Disallow的值 URL 匹配結果

/tmp /tmp yes

/tmp /tmp.html yes

/tmp /tmp/a.html yes

/tmp /tmphoho no

/Hello* /Hello.html yes

/He*lo /Hello,lolo yes

/Heap*lo /Hello,lolo no

html$ /tmpa.html yes

/a.html$ /a.html yes

htm$ /a.html no

9. robots.txt文件用法舉例

例1. 禁止所有搜索引擎訪(fǎng)問(wèn)網(wǎng)站的任何部分
下載該robots.txt文件 User-agent: *
Disallow: /

例2. 允許所有的robot訪(fǎng)問(wèn)
(或者也可以建一個(gè)空文件 "/robots.txt") User-agent: *
Allow: /

例3. 僅禁止Baiduspider訪(fǎng)問(wèn)您的網(wǎng)站 User-agent: Baiduspider
Disallow: /

例4. 僅允許Baiduspider訪(fǎng)問(wèn)您的網(wǎng)站 User-agent: Baiduspider
Allow: /

User-agent: *
Disallow: /

例5. 僅允許Baiduspider以及Googlebot訪(fǎng)問(wèn)
User-agent: Baiduspider
Allow: /

User-agent: Googlebot
Allow: /

User-agent: *
Disallow: /

例6. 禁止spider訪(fǎng)問(wèn)特定目錄
在這個(gè)例子中，該網(wǎng)站有三個(gè)目錄對搜索引擎的訪(fǎng)問(wèn)做了限制，即robot不會(huì )訪(fǎng)問(wèn)這三個(gè)目錄。需要注意的是對每一個(gè)目錄必須分開(kāi)聲明，而不能寫(xiě)成 "Disallow: /cgi-bin/ /tmp/"。 User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/

例7. 允許訪(fǎng)問(wèn)特定目錄中的部分url User-agent: *
Allow: /cgi-bin/see
Allow: /tmp/hi
Allow: /~joe/look
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/

例8. 使用"*"限制訪(fǎng)問(wèn)url
禁止訪(fǎng)問(wèn)/cgi-bin/目錄下的所有以".htm"為后綴的URL(包含子目錄)。 User-agent: *
Disallow: /cgi-bin/*.htm

例9. 使用"$"限制訪(fǎng)問(wèn)url
僅允許訪(fǎng)問(wèn)以".htm"為后綴的URL。 User-agent: *
Allow: /*.htm$
Disallow: /

例10. 禁止訪(fǎng)問(wèn)網(wǎng)站中所有的動(dòng)態(tài)頁(yè)面 User-agent: *
Disallow: /*?*

例11. 禁止Baiduspider抓取網(wǎng)站上所有圖片
僅允許抓取網(wǎng)頁(yè)，禁止抓取任何圖片。 User-agent: Baiduspider
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

例12. 僅允許Baiduspider抓取網(wǎng)頁(yè)和.gif格式圖片
允許抓取網(wǎng)頁(yè)和gif格式圖片，不允許抓取其他格式圖片 User-agent: Baiduspider
Allow: /*.gif$
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.png$
Disallow: /*.bmp$

例13. 僅禁止Baiduspider抓取.jpg格式圖片 User-agent: Baiduspider
Disallow: /*.jpg$

10. robots.txt文件參考資料

robots.txt文件的更具體設置,請參看以下鏈接：
Web Server Administrator's Guide to the Robots Exclusion Protocol
HTML Author's Guide to the Robots Exclusion Protocol
The original 1994 protocol description, as currently deployed
The revised Internet-Draft specification, which is not yet completed or implemented

相關(guān)文章：

利用robots.txt禁止百度蜘蛛Baidusppider抓取

User-agent: * Disallow: / Allow: /complain/ Allow: /media_partners/ Allow: /about/ Allow: /user_agreement/ User-agent: ByteSpider Allow: / User-agent: ToutiaoSpider Allow: / 以上是今日頭條的robots.txt，禁止所有搜索引擎收錄，同時(shí)又...

【官方說(shuō)法】robots文件是否支持中文目錄

有同學(xué)問(wèn)百度站長(cháng)學(xué)院一個(gè)關(guān)于robots的問(wèn)題：我們有個(gè)站點(diǎn)的目錄結構使用的是中文，這樣式兒的：www.a.com/冒險島/123.html，那在制作robots文件和sitemap文件的時(shí)候，可以直接使用中文嗎？百度能...

網(wǎng)站誤封Robots該如何處理

robots文件是搜索生態(tài)中很重要的一個(gè)環(huán)節，同時(shí)也是一個(gè)很細節的環(huán)節。很多站長(cháng)同學(xué)在網(wǎng)站運營(yíng)過(guò)程中，很容易忽視r(shí)obots文件的存在，進(jìn)行錯誤覆蓋或者全部封禁robots，造成不必要損失！那...

禁止百度圖片搜索收錄某些圖片的方法

目前百度圖片搜索也使用了與百度網(wǎng)頁(yè)搜索相同的spider，如果想禁止Baiduspider抓取網(wǎng)站上所有圖片、禁止或允許Baiduspider抓取網(wǎng)站上的某種特定格式的圖片文件可以通過(guò)設置robots實(shí)現：西安廣告...

使用robots巧妙避免蜘蛛黑洞

對于百度搜索引擎來(lái)說(shuō)，蜘蛛黑洞特指網(wǎng)站通過(guò)極低的成本制造出大量參數過(guò)多、內容類(lèi)同但url不同的動(dòng)態(tài)URL ，就像一個(gè)無(wú)限循環(huán)的黑洞，將spider困住。spider浪費了大量資源抓取的卻是無(wú)效網(wǎng)...

robots.txt寫(xiě)法_怎么寫(xiě)robots

robots是站點(diǎn)與spider溝通的重要渠道，站點(diǎn)通過(guò)robots文件聲明該網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。請注意，僅當您的網(wǎng)站包含不希望被搜索引擎收錄的內容...

百度站長(cháng)平臺robots工具升級公告

親愛(ài)的網(wǎng)站管理員，很高興的告訴大家，百度站長(cháng)平臺 robots 工具全新升級，升級后能夠實(shí)時(shí)查看網(wǎng)站在百度中已生效的的robots文件，并支持對robots進(jìn)行語(yǔ)法及邏輯校驗，有助于站長(cháng)更清晰的...

怎樣寫(xiě)robots文件_robots文件寫(xiě)法技巧_robot.txt的例子

資料一 1.robots.txt文件是什么 robots.txt是一個(gè)純文本文件，是搜索引擎中訪(fǎng)問(wèn)網(wǎng)站的時(shí)候要查看的第一個(gè)文件。robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。每個(gè)站點(diǎn)最好建立...

robots.txt文件的格式

robots.txt文件包含一條或更多的記錄，這些記錄通過(guò)空行分開(kāi)（以CR,CR/NL, or NL作為結束符），每一條記錄的格式如下所示： field:optional spacevalueoptionalspace 在該文件中可以使用#進(jìn)行注解，具體使...

robots.txt文件是什么？

搜索引擎通過(guò)一種程序robot（又稱(chēng)spider），自動(dòng)訪(fǎng)問(wèn)互聯(lián)網(wǎng)上的網(wǎng)頁(yè)并獲取網(wǎng)頁(yè)信息。您可以在您的網(wǎng)站中創(chuàng )建一個(gè)純文本文件robots.txt，在這個(gè)文件中聲明該網(wǎng)站中不想被robot 訪(fǎng)問(wèn)的部分，這...

上一篇：被黑和站點(diǎn)安全

下一篇：使用Robots.txt引導百度爬蟲(chóng)合理分配抓取資源

聯(lián)系我們

公司：西安蟠龍網(wǎng)絡(luò )科技有限公司

聯(lián)系人：張經(jīng)理

手機/微信：

Q Q：

地址：西安市雁塔區唐延南路11號逸翠園i都會(huì )

成功案例

西安網(wǎng)站建設西安云翔電子科技

西安東美環(huán)境藝術(shù)工程有限責任公司

西安做網(wǎng)站陜西旭博電子科技有限公司

陜西知行教育科技有限公司

陜西浩德建設工程有限公司

藏脈國醫官方網(wǎng)站

常見(jiàn)問(wèn)題

阿里云安全組如何放行端口？放行所有全部端口？

域名的解析與綁定教程

獨立IP的虛擬主機是什么？有什么好處

網(wǎng)站策劃方案_企業(yè)網(wǎng)站建設設計制作SEO營(yíng)銷(xiāo)方案書(shū)

做企業(yè)網(wǎng)站用什么空間比較好？

企業(yè)網(wǎng)站備案需要什么資料

售后服務(wù)

售后服務(wù)

售后保障

網(wǎng)站建設的付款方式？

網(wǎng)站做好了，還能修改嗎？

你們做網(wǎng)站SEO優(yōu)化排名嗎

網(wǎng)站空間域名怎么續費

不會(huì )使用網(wǎng)站后臺怎么辦

行業(yè)資訊

了解三大定律，抓住SEO新機遇
一自從百度整改競價(jià)排名，將廣告位削減為4個(gè)位置之后，企業(yè)可以說(shuō)是幾家歡喜幾家愁。當然發(fā)愁的明顯多過(guò)歡喜的。那么究竟誰(shuí)在竊喜呢？顯然是那些在SEO自然排名上有優(yōu)勢的企業(yè)...制作企業(yè)網(wǎng)站多少錢(qián)網(wǎng)站公司給別人做網(wǎng)站的公司

新手用織夢(mèng)建站最先遇到的問(wèn)題及解決方式
眾所周知，網(wǎng)站推廣，網(wǎng)站運維、seo優(yōu)化等等與網(wǎng)站有關(guān)的互聯(lián)網(wǎng)服務(wù)，都有一個(gè)共同點(diǎn)，就是必須得有一個(gè)網(wǎng)站，網(wǎng)站是互聯(lián)網(wǎng)最重要的組成部分也是最基礎的單元，隨著(zhù)互聯(lián)網(wǎng)的發(fā)...網(wǎng)頁(yè)制作西安搞一個(gè)網(wǎng)站多少錢(qián)西安好的網(wǎng)站建設公司

wordpress自動(dòng)生成tag標簽插件-WP Auto Keywords
插件介紹 wordpress程序網(wǎng)站在發(fā)布文章時(shí)可以給每一片文章添加與之相關(guān)的TAG標簽，對于TAG標簽可以生成很多頁(yè)面，增加搜索引擎對內容的抓取量。 WP Auto Keywords插件就是一款能自動(dòng)給文章添加...

帝國CMS安全防護設置詳細教程！
帝國CMS是什么程序帝國CMS是一套開(kāi)源的靜態(tài)頁(yè)面程序，憑借超高的擴展性，很多知名的新聞?wù)军c(diǎn)、行業(yè)站點(diǎn)都是應用的帝國CMS后端。因為帝國CMS和dedecms一樣都是生成靜態(tài)頁(yè)面的，所以非常利于...

用 DNS 廠(chǎng)商的 URL 解析(包括顯性和隱性)跳轉
域名解析DNS分為顯性URL和隱形URL，顯性URL和隱形URL有什么區別？隱形URL和顯性URL哪個(gè)更有利于SEO？顯性URL相當于域名了302重定向，隱形URL使用iframe框架技術(shù)隱藏真實(shí)目標地址，顯性URL更有利于...

dedecms簡(jiǎn)略標題（副標題）使用方法教程
在常見(jiàn)的CMS系統中，我對dedecms算是比較熟悉的，自己網(wǎng)站用的也是這個(gè)系統。系統功能強大使用靈活，相信這也是它受到大多數中小站長(cháng)青睞的原因。再好的系統也有照顧不周的地方，很多站...

首頁(yè) 關(guān)于服務(wù) 案例聯(lián)系新聞分類(lèi) 營(yíng)銷(xiāo) 競價(jià)托管網(wǎng)站托管新聞營(yíng)銷(xiāo) 軟文營(yíng)銷(xiāo)網(wǎng)站模板 top

聯(lián)系我們Contact

西安蟠龍網(wǎng)絡(luò )科技有限公司       電話(huà)：   Q Q：
地址：西安市雁塔區唐延南路11號逸翠園i都會(huì )   西安劍鋒網(wǎng)絡(luò )營(yíng)銷(xiāo)：劍鋒所指，所向披靡西安劍鋒網(wǎng)絡(luò )-西安網(wǎng)站建設團隊！西安網(wǎng)站建設公司多年行業(yè)經(jīng)驗、企業(yè)品牌網(wǎng)站建設；陜西網(wǎng)站建設、網(wǎng)絡(luò )營(yíng)銷(xiāo)公司歡迎咨詢(xún)來(lái)電！本土靠譜的西安網(wǎng)絡(luò )公司西安做網(wǎng)站西安網(wǎng)站建設論壇模板庫西安seo

立即通話(huà)

在線(xiàn)咨詢(xún)

QQ咨詢(xún)

最新特惠

亚洲精品视频一区二区,一级毛片在线观看视频,久久国产a,狠狠狠色丁香婷婷综合久久五月,天天做天天欢摸夜夜摸狠狠摸