如何查看網(wǎng)站被百度抓取的情況?
百度用于抓取網(wǎng)頁(yè)的程序叫做Baiduspider - 百度蜘蛛,我們查看網(wǎng)站被百度抓取的情況主要是分析,網(wǎng)站日志里百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態(tài)碼。
查看日志的方式:
通過(guò)FTP,在網(wǎng)站根目錄找到一個(gè)日志文件,文件名一般包含log,下載解壓里面的記事本,這即是網(wǎng)站的日志,記錄了網(wǎng)站被訪(fǎng)問(wèn)和操作的情況。專(zhuān)業(yè)制作網(wǎng)站西安,西安制做網(wǎng)站公司推薦閱讀>>> 網(wǎng)站日志的作用,
因為各個(gè)服務(wù)器和主機的情況不同,不同的主機日志功能記錄的內容不同,有的甚至沒(méi)有日志功能。
日志內容如下:
61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"
分析:
GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 這個(gè)頁(yè)面。
200 代表成功抓取。
8450 代表抓取了8450個(gè)字節。
如果你的日志里格式不是如此,則代表日志格式設置不同。百度影樓競價(jià)賬戶(hù)托管,西安網(wǎng)站建設工作室推薦閱讀>>> 網(wǎng)站日志分析方法,
很多日志里可以看到 200 0 0和200 0 64 則都代表正常抓取。
抓取頻率是通過(guò)查看每日的日志里百度蜘蛛抓取次數來(lái)獲知。抓取頻率并沒(méi)有一個(gè)規范的時(shí)間表或頻率數字,我們一般通過(guò)多日的日志對比來(lái)判斷。當然,我們希望百度蜘蛛每日抓取的次數越多越好。
在網(wǎng)站出現問(wèn)題的情況下,通過(guò)查看網(wǎng)站日志,查看網(wǎng)站的HTTP返回值是否正常,
相關(guān)文章:
-
1、什么是網(wǎng)站日志 網(wǎng)站日志是記錄web服務(wù)器接收處理請求以及運行時(shí)錯誤等各種原始信息的以log結尾的文件,確切的講,應該是服務(wù)器日志。網(wǎng)站日志最大的意義是記錄網(wǎng)站運營(yíng)中比如空間的...
-
最近有不少朋友問(wèn)我怎么看SEO日志,Emmar在網(wǎng)上找了一些相關(guān)的資料并且結合自己的經(jīng)驗,為大家提供一個(gè)比較完整的日志文件的閱讀和分析方法: 廢話(huà)不多說(shuō),進(jìn)入主題: 問(wèn)題一、網(wǎng)站LOG日志...
-
做百度優(yōu)化的過(guò)程中很重要的一點(diǎn),就是IIS日志的分析。通過(guò)來(lái)訪(fǎng)記錄的代碼我們能準備的了解到網(wǎng)站出現的很多問(wèn)題。以IIS日志上的百度蜘蛛IP為例: 123.125.68.*這個(gè)蜘蛛每每來(lái),另外來(lái)的少,示...
-
#Software: Microsoft Internet Information Services 6.0 #Software:表示軟件名稱(chēng) #Version: 1.0 #Version:表示版本號 #Date: 2013-03-13 00:05:17 #Date:表示時(shí)間 #Fields:說(shuō)明如下#Fields: date time s-sitename s-ip cs-method cs-uri-s...
-
網(wǎng)站日志一般存放在虛擬主機的logfiles文件夾下,可以通過(guò)FTP工具將網(wǎng)站日志下載下來(lái),下載下來(lái)的為log格式的文檔,可通過(guò)txt文檔方式查看。 如何查看自己的服務(wù)器的日記? (以Windows 2003系統...
-
通過(guò)網(wǎng)站日志可以清楚的得知訪(fǎng)客和服務(wù)端等應用是否正常運行,或者存在哪些缺陷,失效組件等信息。 對于專(zhuān)業(yè)從事搜索引擎優(yōu)化工作者而言,網(wǎng)站日志可以記錄各搜索引擎蜘蛛機器人爬行...
-
1、訪(fǎng)問(wèn)次數、停留時(shí)間、抓取量 從這三項數據中我們可以得知:平均每次抓取頁(yè)面數、單頁(yè)抓取停留時(shí)間和平均每次停留時(shí)間。 平均每次抓取頁(yè)面數=總抓取量/訪(fǎng)問(wèn)次數 單頁(yè)抓取停留=每次停...
-
網(wǎng)站日志是記錄web服務(wù)器接收處理請求以及運行時(shí)錯誤等各種原始信息的以log結尾的文件,確切的講,應該是服務(wù)器日志。網(wǎng)站日志最大的意義是記錄網(wǎng)站運營(yíng)中比如空間的運營(yíng)情況,被訪(fǎng)問(wèn)...
-
作SEO時(shí),我們經(jīng)常會(huì )在日志上看到類(lèi)似這樣的代碼: 61.135.166.232 - - [31/Dec/2007:02:30:11 +0800] GET /category21.html HTTP/1.1 200 10968 - Baiduspider+(+http://www.baidu.com/search/spider.htm) 66.249.70.172 - - [31/Dec/2007:03:36...
- 上一篇:SEO常見(jiàn)現象-快照回檔-沙盒等
- 下一篇:網(wǎng)站日志是什么?