如何制作對應關(guān)系sitemap文件
通過(guò)XML文件描述url級別的PC頁(yè)與手機頁(yè)的對應關(guān)系,網(wǎng)站當前有對應關(guān)系的所有PC頁(yè)面url均需要給出。(xml格式sitemap的基礎制作方法可點(diǎn)擊了解)
具體的對應關(guān)系sitemap(url級別)格式如下:
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<url>
<!--必填標簽,表示PC頁(yè)的url地址 -->
<loc><![CDATA[http://www.yoursite.html/yoursite.html]]></loc>
<data>
<display>
<!—可選標簽,表示該PC頁(yè)對應的html5版式的手機頁(yè)的url地址 -->
<html5_url><![CDATA[http://html5.yoursite.html/yoursite.html]]></html5_url>
<!—可選標簽,表示該PC頁(yè)對應的wml版式的手機頁(yè)的url地址 -->
<wml_url><![CDATA[http://wml.yoursite.html/yoursite.html]]></wml_url>
<!—可選標簽,表示該PC頁(yè)對應的xhtml版式的手機頁(yè)的url地址 -->
<xhtml_url><![CDATA[http://xhtml.yoursite.html/yoursite.html]]></xhtml_url>
</display>
</data>
</url>
</urlset>
例如:
<?xmlversion="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc><![CDATA[http://www.sina.com.cn/]]></loc>
<data>
<display>
<html5_url><![CDATA[http://html5.sina.com.cn/]]></html5_url>
<wml_url><![CDATA[http://wml.sina.com.cn/]]></wml_url>
<xhtml_url><![CDATA[http://3g.sina.com.cn/]]></xhtml_url>
</display>
</data>
</url>
<url>
<loc><![CDATA[http://www.sohu.com/]]></loc>
<data>
<display>
<html5_url><![CDATA[http://html5.sohu.com/]]></html5_url>
<wml_url><![CDATA[http://wml.sohu.com/]]></wml_url>
<xhtml_url><![CDATA[http://3g.sohu.com/]]></xhtml_url>
</display>
</data>
</url>
</urlset>
如何制作對應關(guān)系sitemap文件(pattern級別)?
1、格式
Pattern級別對應關(guān)系提交支持XML sitemap的形式,每個(gè)xml sitemap文件可包含1組或者多組pattern對應關(guān)系。格式說(shuō)明如下:西安專(zhuān)業(yè)做網(wǎng)站公司,公司網(wǎng)頁(yè)制作推薦閱讀>>> 百度開(kāi)啟“輕舟”計劃 免費快速架設移動(dòng)站點(diǎn),
示例: 各URL字段可以被CDATA標記包含,如<![CDATA[url]]> 。
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<!-- 表示news.163.com下的一組pattern對應關(guān)系-->
<url>
<loc><![CDATA[http://news.163.com/]]></loc>
<data>
<display>
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>
<wml_url_pattern ><![CDATA[http://wap.163.com/wml/page/ntes/${1}/${2}/${3}/${4}.wml]]></wml_url_pattern>
</display>
</data>
</url>
2、字段詳細說(shuō)明
pc_url_pattern: 表示PC頁(yè)pattern,在PC頁(yè)url的基礎上,首先確定url中哪些路徑或參數是可替換的。然后根據其類(lèi)型,使用正則匹配符號(\d+)或者(\w+)表示該路徑或參數。(\d+)表示純數字字符串,(\w+)表示數字或字母組成的字符串。
xhtml_url_pattern / html5_url_pattern/ wml_url_pattern:表示xhtml/html5/wml版式的手機頁(yè)pattern,在手機頁(yè)url的基礎上,根據可替換參數在對應的PC頁(yè)pattern中出現的順序,依次用${1},${2},……表示該參數。
3、舉例
以網(wǎng)易的新聞頁(yè)“漫游接電話(huà)移動(dòng)也不要錢(qián)了”為例,其PC頁(yè)url地址為http://news.163.com/09/1001/07/5KH8DE1F000120GR.html, 其對應的xhtml格式的手機頁(yè)url地址為http://3g.163.com/news/09/1001/07/5KH8DE1F000120GR.html。
步驟一:確定PC頁(yè)中的可替換參數或者路徑,得到其位置序號和類(lèi)型。
根據網(wǎng)站自身url的層次結構,其中09,1001,07和5KH8DE1F000120GR為動(dòng)態(tài)可替換的路徑。除5KH8DE1F000120GR為字母和數字混合外,其余均為純數字。西安網(wǎng)站制作公司 那家好,西安建站推薦閱讀>>> 百度要革自己的命移動(dòng)搜索或取消PC網(wǎng)頁(yè)收錄,
步驟二:根據可替換參數或路徑的類(lèi)型,得到PC頁(yè)pattern (即sitemap中的pc_url_pattern)。
使用正則匹配符號(\d+)或者(\w+)表示該路徑或參數。(\d+)表示純數字字符串,(\w+)表示數字或字母組成的字符串。
步驟三:根據手機頁(yè)url,以及可替換參數在步驟一中的位置序號,依次用${1},${2},……表示替換掉手機頁(yè)url中的可替換參數或路徑,得到手機頁(yè)pattern。
例子中,依次用${1},${2},${3}和${4}替換掉09,1001,07和5KH8DE1F000120GR,得到手機頁(yè)pattern為http://3g.163.com/news/${1}/${2}/${3}/${4}.html。
步驟四:根據手機頁(yè)的頁(yè)面類(lèi)型,將手機頁(yè)pattern寫(xiě)入對應的字段。各字段可以用CDATA標記包含,如<![CDATA[url]]> 。
如示例中該pattern的手機頁(yè)面為xhtml版式,將pattern http://3g.163.com/news/${1}/${2}/${3}/${4}.html 寫(xiě)入到xhtml_url_pattern字段中。
最終得到sitemap文件如下:
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<!—表示news.163.com下的一組pattern對應關(guān)系-->
<url>
<loc><![CDATA[http://news.163.com/]]></loc>
<data>
<display>
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>
<!-- 一組PC pattern可能含有多個(gè)版式的手機頁(yè)pattern -->
</display>
</data>
</url>
<!-- 下一組pattern放在一個(gè)新的url節點(diǎn)內 -->
</urlset>
備注
· 通過(guò)sitemap只能提交具有簡(jiǎn)單對應關(guān)系的pattern,也即,在PC頁(yè)url與手機頁(yè)路徑或參數之間存在直接的對應關(guān)系,使得機器能根據PC頁(yè)url按照一定的正則pattern自動(dòng)計算出與其對應的手機頁(yè)的url。如http://news.sina.com.cn/c/2012-05-27/235824487992.shtml和http://news.sina.cn/?sa=t124v71d6155414&pos=102&vt=4雖然是對應的,但是從url本身很難找到聯(lián)系,就不屬于簡(jiǎn)單對應關(guān)系。
· 正則匹配符號只支持(\d+)和(\w+),且不可嵌套使用,如(d+(\w+))這種形式不合法。域名中不可出現正則匹配符號。
· pattern中,站長(cháng)無(wú)需對特殊字符進(jìn)行轉義,例如不需要用\.代替. ,不需要用&代替&。
· pattern級別對應關(guān)系和url級別對應關(guān)系的sitemap格式不一樣,請分別制作不同的文件并分開(kāi)提交。
相關(guān)文章:
-
隨著(zhù)人們將越來(lái)越多的時(shí)間放在手機上,以前只在電腦上才能完成的購物、聊天、信息獲取等行為越來(lái)越傾向于移動(dòng)手機上了。手機網(wǎng)民的增多,巨大的流量又會(huì )形成倒逼壓力,讓之前不關(guān)注...
-
親愛(ài)的網(wǎng)站管理員: 秉承用戶(hù)至上的原則,百度移動(dòng)搜索不斷更新系統、升級算法,一切都為了讓用戶(hù)擁有更順暢的搜索體驗。百度移動(dòng)搜索冰桶算法近期將升級至2.0版本。 2.0版本將嚴厲打擊...
-
親愛(ài)的網(wǎng)站管理員: 秉承用戶(hù)至上的原則,百度移動(dòng)搜索不斷更新系統、升級算法,一切都為了讓用戶(hù)擁有更順暢的搜索體驗。百度移動(dòng)搜索冰桶算法近期將升級至3.0版本。3.0版本將嚴厲打擊...
-
親愛(ài)的站長(cháng)朋友們: 大家好!前段時(shí)間跟大家分享了關(guān)于百度移動(dòng)搜索冰桶算法的情況,一期上線(xiàn)該算法后,我們發(fā)現大部分相關(guān)站點(diǎn)已經(jīng)進(jìn)行了調整,強制用戶(hù)下載或全屏彈窗的情況得到了...
-
百度對站點(diǎn)的收錄不理想,導致站內搜索結果數太少? 收錄不及時(shí),導致最新的頁(yè)面搜不到? 您可以在結果頁(yè)管理的提升收錄效果功能中提交數據,從而提升您的站內搜索收錄時(shí)效性和覆蓋率...
-
下面介紹一些有關(guān)標記的例子及解釋。 一、meta 標簽分兩大部分:HTTP 標題信息(http-equiv)和頁(yè)面描述信息(name)。 1、http-equiv 屬性的 Content-Type 值(顯示字符集的設定) 說(shuō)明:設定頁(yè)面使用...
-
百度轉碼聲明中提到3個(gè)禁止百度轉碼的方法,對WordPress主題而言,最簡(jiǎn)單的就是在header.php文件中head/head標簽內增加下面的一段代碼: meta http-equiv=Cache-Control content=no-transform / 注:之前的 meta...
-
隨著(zhù)移動(dòng)設備不斷的普及,人們正式步入了移動(dòng)時(shí)代,那么作為一枚為互聯(lián)網(wǎng)提供內容的站長(cháng)朋友,如何保證自己和自己的網(wǎng)站在移動(dòng)化來(lái)襲之時(shí)不被時(shí)代拋棄,不被我們的用戶(hù)拋棄呢? 今天...
-
1月21日百度站長(cháng)平臺微信公眾帳號推出了有獎問(wèn)答活動(dòng),將近400名同學(xué)完整地做完了8道與《百度搜索Mobile Friendly(移動(dòng)友好度)標準V1.0》有關(guān)的選擇題,但是完全答對的人并不多哦!今天學(xué)院...
-
百度搜索是全球最大的中文搜索引擎。在移動(dòng)互聯(lián)時(shí)代,百度每天響應移動(dòng)搜索請求高達幾十億次,導向互聯(lián)網(wǎng)的流量幾十億量級,且快速增長(cháng)。面對移動(dòng)用戶(hù)的迅猛崛起,站長(cháng)們紛紛涌入移...