13996527831
詳細

移動適配如何撰寫pattern對應的xml文件?

發表日期:2015-06-17 19:04:35   作者來源:米卓網絡   瀏覽:    

  百度在移動端的抓取識別能力相對于PC端來講,還依然薄弱。我們需要利用百度站長平臺的移動適配來幫助搜索引擎加快抓取識別的步伐。

  移動適配分為URL對應關系和pattern對應關系兩種。百度官方建議盡量采用pattern方式,因為URL方式需要每天不斷補充提交新的對應文件,不僅相對繁瑣,而且效率也比較低。而pattern方式只需要站長根據PC端與移動端URL的對應規律,撰寫一次對應文件后,搜索引擎就可以根據此文件不斷將移動端URL提取出來,并且抓取識別。

  下面重慶網站建設公司簡單了解一下如何撰寫pattern對應的xml文件:

        <?xml version="1.0"encoding="UTF-8"?>
        <urlset>
        <url>
        <loc><![CDATA[http://news.baidu.com/]]></loc>
        <data>
        <display>
        <pc_url_pattern><![CDATA[http://news.baidu.com/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>
        <xhtml_url_pattern ><![CDATA[http://m.baidu.com/news/${1}/${2}/${3}.html]]></xhtml_url_pattern>
        <html5_url_pattern ><![CDATA[http://html5.baidu.com/news/${1}/${2}/${3}.html]]></html5_url_pattern>
        <wml_url_pattern ><![CDATA[http://wap.baidu.com/news/${1}/${2}/${3}.html]]></wml_url_pattern>
        </display>
        </data>
        </url>
        </urlset>

  Pattern對應關系示例:

  以上示例代碼,其實最核心的地方就是PC端與移動端對應時用到的匹配字符(正則表達式元字符),目前適配的xml文件中正則匹配符號只支持(\d+)和(\w+),其中\d表示匹配數字,\w表示匹配字母或數字或下劃線或漢字,而后面的+號則表示重復一次或更多次(即該位置出現的字母或數字至少出現2個以上,每個字母或數字可以不同);對應的移動端路徑中類似于${1}這類的數字則表示替換PC路徑中對應位置的參數。

  還有一點需要注意的是,移動端網站可能是同時具備多個版本,目前百度官方針對適配文件給出的是xhtml、html5、wml三個版本,如果你的網站同時具備這幾個版本或其中某個版本,在xml文件中準確寫出即可,如果只有一個可以只寫一個的。

极速排列3