Sitemap是什么?
Sitemap 可方便網(wǎng)站管理員通知搜索引擎他們網(wǎng)站上有哪些可供抓取的網(wǎng)頁(yè)。最簡(jiǎn)單的 Sitepmap 形式,就是XML 文件,在其中列出網(wǎng)站中的網(wǎng)址以及關(guān)于每個(gè)網(wǎng)址的其他元數據(上次更新的時(shí)間、更改的頻率以及相對于網(wǎng)站上其他網(wǎng)址的重要程度為何等),以便搜索引擎可以更加智能地抓取網(wǎng)站。
Google、雅虎、和微軟都支持一個(gè)被稱(chēng)為xml網(wǎng)站地圖(xml Sitemaps)的協(xié)議,而百度Sitemap是指百度支持的收錄標準,在原有協(xié)議上做出了擴展。百度sitemap的作用是通過(guò)Sitemap告訴百度蜘蛛全面的站點(diǎn)鏈接,優(yōu)化自己的網(wǎng)站。百度Sitemap分為三種格式:txt文本格式、xml格式、Sitemap索引格式。
優(yōu)化步驟
1,我們需要為每一個(gè)頁(yè)面鏈接介紹一段簡(jiǎn)短的文字,這樣可以提示這部分內容是關(guān)于哪方面的。
2,要為谷歌,百度這樣的搜索引擎提供一條"綠色的通道"為蜘蛛提供可以瀏覽整個(gè)網(wǎng)站的鏈接,使搜索引擎能迅速收錄網(wǎng)站的主要的網(wǎng)頁(yè),例如首頁(yè),詳細頁(yè)及幫助等頁(yè)面。
3,如果用戶(hù)已經(jīng)在你網(wǎng)站上搜索過(guò)某些文章或信息,此時(shí)就需要有一個(gè)關(guān)于已經(jīng)查看過(guò)的頁(yè)面或列表.如果沒(méi)有這些程序,那么你需要做一個(gè)文字鏈接到某個(gè)頁(yè)面并且這個(gè)頁(yè)面是可以得到所有想查詢(xún)的內容鏈接以便告訴用戶(hù)如何去查找他們需要查找的信息。
4,如果你網(wǎng)站的鏈接因為某些原因例如鏈接失效過(guò)無(wú)法獲得原來(lái)鏈接的話(huà),此時(shí)你就需要做一個(gè)錯誤頁(yè)面的轉向,這個(gè)錯誤的轉向頁(yè)面你也可以充分發(fā)揮你的想象力以便做的更加漂亮。
5,這一點(diǎn)很重要,你可以在網(wǎng)站地圖的文本和超級鏈接里提到你要優(yōu)化的主要的關(guān)鍵詞,以便幫助搜索引擎來(lái)識別。
6,間接的幫助搜索引擎能夠輕輕松松索引到一些動(dòng)態(tài)的頁(yè)面,最好此時(shí)的動(dòng)態(tài)頁(yè)面你將其為偽靜態(tài)化,當然靜態(tài)化是最好的了,因為搜索引擎最喜歡靜態(tài)化的頁(yè)面。西安企業(yè)網(wǎng)站建設公司,西安網(wǎng)頁(yè)設計公司推薦閱讀>>> Sitemap-網(wǎng)站地圖包括:?普通 Html 格式的網(wǎng)站地圖與XML Sitemap,
格式
Google SiteMap
Google SiteMap Protocol是Google自己推出的一種站點(diǎn)地圖協(xié)議,此協(xié)議文件基于早期的robots.txt文件協(xié)議,并有所升級。在Google官方指南中指出加入了Google SiteMap文件的網(wǎng)站將更有利于Google網(wǎng)頁(yè)爬行機器人的爬行索引,這樣將提高索引網(wǎng)站內容的效率和準確度。文件協(xié)議應用了簡(jiǎn)單的XML格式,一共用到6個(gè)標簽,其中關(guān)鍵標簽包括鏈接地址、更新時(shí)間、更新頻率和索引優(yōu)先權
<urlset xmlns=“網(wǎng)頁(yè)列表地址”>
<url>
<loc>網(wǎng)址</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>網(wǎng)址</loc>
<lastmod>2005-06-02T20:20:36Z</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
百度sitemap
<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc>網(wǎng)頁(yè)地址</loc>
<lastmod>2010-01-01</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>
XML標簽
changefreq:頁(yè)面內容更新頻率。
lastmod:頁(yè)面最后修改時(shí)間
loc:頁(yè)面永久鏈接地址
priority:相對于其他頁(yè)面的優(yōu)先權
url:相對于前4個(gè)標簽的父標簽
urlset:相對于前5個(gè)標簽的父標簽
我將一句一句分解講解這個(gè)xml文件的每一個(gè)標簽:
<urlset xmlns="
這一行定義了此xml文件的命名空間,相當于網(wǎng)頁(yè)文件中的<html>標簽一樣的作用。
<url>
這是具體某一個(gè)鏈接的定義入口,你所希望展示在SiteMap文件中的每一個(gè)鏈接都要用<url>和</url>包含在里面,這是必須的。西安營(yíng)銷(xiāo)網(wǎng)站制作,公司建站推薦閱讀>>> 搜索引擎提交sitemap大全(網(wǎng)站地圖),
<loc></loc>
用<loc>描述出具體的鏈接地址,這里需要注意的是鏈接地址中的一些特殊字符必須轉換為XML(HTML)定義的轉義字符,如下表: 字符 轉義后的字符
HTML字符 字符編碼
& 符號 & &
單引號 ' '
雙引號 " "
大于 > >
小于 < <
<lastmod>2005-06-03T04:20:32-08:00</lastmod>
<lastmod>是用來(lái)指定該鏈接的最后更新時(shí)間,這個(gè)很重要。Google的機器人會(huì )在索引此鏈接前先和上次索引記錄的最后更新時(shí)間進(jìn)行比較,如果時(shí)間一樣就會(huì )跳過(guò)不再索引。所以如果你的鏈接內容基于上次Google索引時(shí)的內容有所改變,應該更新該時(shí)間,讓Google下次索引時(shí)會(huì )重新對該鏈接內容進(jìn)行分析和提取關(guān)鍵字。這里必須用ISO 8601中指定的時(shí)間格式進(jìn)行描述,格式化的時(shí)間格式如下:
年:YYYY(2005)
年和月:YYYY-MM(2005-06)
年月日:YYYY-MM-DD(2005-06-04)
年月日小時(shí)分鐘:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
年月日小時(shí)分鐘秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)
這里需注意的是TZD,TZD指定就是本地時(shí)間區域標記,像中國就是+08:00了
<changefreq>always</changefreq>
用這個(gè)標簽告訴Google此鏈接可能會(huì )出現的更新頻率,比如首頁(yè)肯定就要用always(經(jīng)常),而對于很久前的鏈接或者不再更新內容的鏈接就可以用yearly(每年)。這里可以用來(lái)描述的單詞共這幾個(gè):"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。
<priority>1.0</priority>
<priority>是用來(lái)指定此鏈接相對于其他鏈接的優(yōu)先權比值,此值定于0.0 - 1.0之間
還有</url>和</urlset>,這兩個(gè)就是來(lái)關(guān)閉xml標簽的,這和HTML中的</body>和</html>是一個(gè)道理
另外需要注意的是,這個(gè)xml文件必須是utf-8的編碼格式,不管你是手動(dòng)生成還是通過(guò)代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡(jiǎn)單的方法就是用記事本打開(kāi)xml然后另存為時(shí)選擇編碼(或轉換器)為UTF-8。西安網(wǎng)站策劃制作,網(wǎng)站設計推薦閱讀>>> seoer必備常用站長(cháng)工具,
登陸Google提交你的SiteMap文件,鏈接,如果還沒(méi)有注冊或者登陸Google,就先用自己的帳號登陸Google,登陸后轉到Your Sitemaps狀態(tài)頁(yè)面,可以點(diǎn)擊那個(gè)Add a Sitemap + 跳轉到提交頁(yè)面進(jìn)行Sitemap文件的提交。建議文件放在你的站點(diǎn)根目錄下。給Google提交你的Sitemap URL后可以看見(jiàn)在列表里已存在,不過(guò)這時(shí)候還沒(méi)有生效,必須過(guò)幾個(gè)小時(shí)后Status欄變成OK表示正式生效,如果不是OK,可以查看Google給出的狀態(tài)標示解釋看看是什么原因
相關(guān)文章:
-
帝國CMS是什么程序 帝國CMS是一套開(kāi)源的靜態(tài)頁(yè)面程序,憑借超高的擴展性,很多知名的新聞?wù)军c(diǎn)、行業(yè)站點(diǎn)都是應用的帝國CMS后端。因為帝國CMS和dedecms一樣都是生成靜態(tài)頁(yè)面的,所以非常利于...
-
域名解析DNS分為顯性URL和隱形URL,顯性URL和隱形URL有什么區別?隱形URL和顯性URL哪個(gè)更有利于SEO?顯性URL相當于域名了302重定向,隱形URL使用iframe框架技術(shù)隱藏真實(shí)目標地址,顯性URL更有利于...
-
在常見(jiàn)的CMS系統中,我對dedecms算是比較熟悉的,自己網(wǎng)站用的也是這個(gè)系統。系統功能強大使用靈活,相信這也是它受到大多數中小站長(cháng)青睞的原因。 再好的系統也有照顧不周的地方,很多站...
-
這篇文章主要為大家詳細介紹了dedecms后臺增加php導出excel功能實(shí)現辦法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,有需要的朋友可以收藏方便以后借鑒。 不少朋友希望織夢(mèng)的后臺...
-
插件介紹 wordpress程序網(wǎng)站在發(fā)布文章時(shí)可以給每一片文章添加與之相關(guān)的TAG標簽,對于TAG標簽可以生成很多頁(yè)面,增加搜索引擎對內容的抓取量。 WP Auto Keywords插件就是一款能自動(dòng)給文章添加...
-
5.7 生成列表頁(yè) 改動(dòng) include/arc.listview.class.php 1.先設置 關(guān)閉副欄目(在系統----系統基本參數性能選項里) 2.一般網(wǎng)站不需要 欄目交叉 交叉 所以 找到94行注釋掉: //獲得交叉欄目ID /*if($this-Type...
-
1、公共相同部分用引入1個(gè)靜態(tài)文件方式,不解析 2、arclist標簽進(jìn)來(lái)不使用屬性flag、不使用自定義字段addfields、不使用隨機、相同部分用引入1個(gè)靜態(tài)文件方式,不解析 3、tag標簽或者關(guān)鍵詞內鏈...
-
CSS實(shí)現圖片裁剪居中 其實(shí),css實(shí)現起來(lái)很簡(jiǎn)單,只需要設置img的樣式:object-fit:none即可,不過(guò)你要給img一個(gè)高度,因為裁剪嘛 頁(yè)面:(圖片可以自己隨便截兩張來(lái)測試) !--長(cháng)圖片-- div clas...
-
CSS背景圖片自適應全屏 .bg{ background:url(bg.png) no-repeat; background-size:cover; filter : progid:DXImageTransform.Microsoft.AlphaImageLoader ( enabled=bEnabled , sizingMethod=sSize , src=sURL )//IE特有的濾鏡 }...
-
插件界面 插件功能 支持記錄當天審核記錄 支持可控時(shí)間段審核 支持可控欄目審核 支持審核后生成HTML,包括首頁(yè),欄目列表頁(yè),內容頁(yè) 支持審核后推送到百度和熊掌 支持查看推送記錄 使用...