新浪死鏈處理經(jīng)驗分享
在第四次深“度”接觸結束后,spider工程師表示新浪的死鏈處理工作一直效果不錯,提醒學(xué)院應該請其做個(gè)分享。新浪穩座國家級門(mén)戶(hù)頭把交椅,誰(shuí)還敢說(shuō)自己網(wǎng)站結構的復雜程度可以超越新浪。于是我們請王久明分享一下新浪在死鏈處理和死鏈預防(重要頁(yè)面因修改而產(chǎn)生死鏈)方面的經(jīng)驗。
一、在以下背景下會(huì )較多產(chǎn)生死鏈:
1、時(shí)政新聞的敏感性;
2、來(lái)自監管的刪除需求;西安做網(wǎng)站推薦閱讀>>> 死鏈對網(wǎng)站的影響、產(chǎn)生過(guò)程、解決辦法匯總,
3、頻道(編輯)自身刪改的需求;
4、搜索方期望資源方主動(dòng)優(yōu)化和定期清除的需求
二、死鏈分類(lèi):
由于系統架構、歷史遺留問(wèn)題、多業(yè)務(wù)系統交叉影響等多方面因素,新浪存在如下三種死鏈:
1、協(xié)議死鏈,服務(wù)器端返回HTTP狀態(tài)碼404;西安網(wǎng)站建設推薦閱讀>>> 【官方說(shuō)明】百度搜索標準死鏈官方文檔-協(xié)議死鏈、內容死鏈和跳轉死鏈,
例如:‘誰(shuí)在偽善’
http://news.sina.com.cn/movie/music/1999-06-15/2965.shtml

2,內容死鏈,服務(wù)器端返回HTTP狀態(tài)碼200,無(wú)法設置為404;
例如:http://news.sina.com.cn/c/2015-04-23/184531753084.shtml

3,頁(yè)面需要用戶(hù)和蜘蛛可以正常訪(fǎng)問(wèn),但由于刪改或誤操作導致反復上下線(xiàn)形成協(xié)議死鏈或內容死鏈。例如:http://news.sina.com.cn/2015-12-05/doc-ifxmhqaa9933763.shtml
上線(xiàn)后又下線(xiàn),后又上線(xiàn),甚至反復多次。由于下線(xiàn)期間存在協(xié)議死鏈或內容死鏈的情況,導致百度認為該頁(yè)面應該被刪除,不被收錄,且即使后續重新上線(xiàn)也無(wú)法恢復收錄。對于這種情況,應加以預防。

三、解決方案:
1、協(xié)議死鏈,這個(gè)最符合HTML標準處理方式,站點(diǎn)方面無(wú)須多做什么,如果需要百度快速處理可以通過(guò)百度站長(cháng)平臺的死鏈提交工具(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=4#h2_article_title18)進(jìn)行主動(dòng)提交
2,無(wú)法設置協(xié)議死鏈接,僅主體內容文本被刪除的內容死鏈死鏈,新浪的處理方法是:
1)走事先之制定好的《死鏈標準流程》:用站內標準內容死鏈模板頁(yè)面(告訴用戶(hù)該頁(yè)無(wú)法找到)覆蓋需要刪除的頁(yè)面,5秒后跳轉到統一的全站導航頁(yè),以減少用戶(hù)流失。
2)根據需要,比如根據特定關(guān)鍵詞圈定一批最終需要處理為協(xié)議死鏈的敏感頁(yè)面,將這些頁(yè)面鏈接放到一個(gè)文件里,由專(zhuān)人在服務(wù)器端修改成協(xié)議死鏈。通過(guò)百度站長(cháng)平臺工具進(jìn)行死鏈提交
3,針對反復上下線(xiàn)導致百度誤判為死鏈的情況,新浪的預防辦法是:
1)制度上:系統后臺設置提醒,提醒編輯上線(xiàn)后除非特殊情況不要下線(xiàn);西安網(wǎng)站建設推薦閱讀>>> 如何檢查死鏈,
2)功能上:這種情況在專(zhuān)題運營(yíng)中最常見(jiàn),且影響比單篇新聞頁(yè)要大,由于我站點(diǎn)運營(yíng)規定是不能刪除頁(yè)面的,因此在系統后臺將“刪除專(zhuān)題(對編輯來(lái)說(shuō)就是刪除該專(zhuān)題)”和“將專(zhuān)題調整為不對外顯示(對編輯來(lái)說(shuō)不是刪除,而是暫時(shí)下線(xiàn),調整為外網(wǎng)用戶(hù)無(wú)法訪(fǎng)問(wèn),可隨時(shí)再次重新上線(xiàn))”兩個(gè)功能?chē)栏駞^分開(kāi),并提供回收功能。針對“將專(zhuān)題調整為不對外顯示”這種情況,不再將頁(yè)面更新為內容死鏈(頁(yè)面無(wú)法找到),以免被百度誤判。專(zhuān)題頁(yè)面仍可訪(fǎng)問(wèn),只是站點(diǎn)不設置入口、不進(jìn)行推廣,用戶(hù)沒(méi)有訪(fǎng)問(wèn)來(lái)源而已。
相關(guān)文章:
-
在學(xué)習SEO的時(shí)候我們會(huì )接觸鏈接這個(gè)東西,在SEO界鏈接基本分為內鏈、外鏈(友情鏈接也被稱(chēng)為外鏈)、反鏈、死鏈四大類(lèi)。那么,我為何要單獨闡述死鏈這個(gè)東西呢?因為死鏈是當內鏈和外...
-
在網(wǎng)站日常運營(yíng),死鏈是難免會(huì )產(chǎn)生的,不僅影響了用戶(hù)體驗,也影響了搜索效果;針對這一現象,我們邀請了站長(cháng)社區版主三木為大家分享死鏈處理心得。 本文主要講述死鏈對網(wǎng)站的影響;...
-
大量死鏈對搜索引擎來(lái)講,有什么影響? 1、幾乎很多站都避免不了存在死鏈接,但死鏈率過(guò)高,會(huì )影響搜索引擎對網(wǎng)站的評分。 2、搜索引擎對每個(gè)網(wǎng)站每天抓取的頻次是限額的,若網(wǎng)站存在大...
-
幾乎所有網(wǎng)站都會(huì )出現不再需要展現的網(wǎng)頁(yè),如何處理這樣的網(wǎng)頁(yè)也成為站長(cháng)經(jīng)常談?wù)摰脑?huà)題。為此,百度站長(cháng)學(xué)院專(zhuān)訪(fǎng)了負責死鏈識別處理的工程師,了解到百度眼中的死鏈其實(shí)包括三種:...
-
前段時(shí)間服務(wù)器被入侵,掛了很多博彩之類(lèi)的黑頁(yè),而且全部被百度收錄。 現在把漏洞補好了,但刪除黑頁(yè)文件以后成了死鏈,要怎么讓百度刪除收錄呢? 在網(wǎng)上找了一下,似乎只有檢測網(wǎng)址...
-
上次說(shuō)到如何正確設置死鏈,關(guān)鍵點(diǎn)在于http狀態(tài)碼一定要迅速返回,不要有延遲,那么接下來(lái)使用百度站長(cháng)平臺提供的死鏈提交工具要注意什么呢? 昨天百度站長(cháng)平臺又接到了反饋,站長(cháng)說(shuō)死...
-
在學(xué)習SEO的時(shí)候我們會(huì )接觸鏈接這個(gè)東西,在SEO界鏈接基本分為內鏈、外鏈(友情鏈接也被稱(chēng)為外鏈)、反鏈、死鏈四大類(lèi)。那么,我為何要單獨闡述死鏈這個(gè)東西呢?因為死鏈是當內鏈和外...
-
最近頻繁接到某站長(cháng)反饋:已對自己論壇的垃圾帖做死鏈處理、并已使用百度站長(cháng)平臺提供的死鏈提交工具,但相關(guān)鏈接依然未得到處理。經(jīng)百度站長(cháng)平臺追查,發(fā)現該站長(cháng)提供的所謂死鏈并...
-
第一步,處理網(wǎng)站已存在的死鏈,制作死鏈文件篩查網(wǎng)站內部存在的死鏈,并將這些死鏈頁(yè)面設置成為404頁(yè)面,即百度訪(fǎng)問(wèn)它們時(shí)返回404代碼。將需提交的死鏈列表制作成一個(gè)死鏈文件,制作...
-
一、死鏈介紹 1、什么是死鏈 頁(yè)面已經(jīng)無(wú)效,無(wú)法對用戶(hù)提供任何有價(jià)值信息的頁(yè)面就是死鏈接,包括協(xié)議死鏈和內容死鏈兩種形式。 協(xié)議死鏈:頁(yè)面的TCP協(xié)議狀態(tài)/HTTP協(xié)議狀態(tài)明確表示的死...