一、Sitemap格式:
Sitemap網站地圖可以采用如下三種格式的文件向搜索引擎提交,文件編碼可以是UTF-8或GBK:
1)標準的XML格式文件
2)文本TXT格式文件
3)Sitemap索引文件(可同時包含多個Sitemap文件)
二、Sitemap大?。?/strong>
1)單個Sitemap文件:大小不超過10MB,且包含不超過50000個網址。如果網站所包含的網址超過50,000個,則可將列表分割成多個Sitemap文件,放在Sitemap索引中。
2)單個Sitemap索引文件:大小不能超過500M,如果超過請提交多個Sitemap索引文件接口。
三、XML格式Sitemap說明
1) XML格式舉例
- <?xml version="1.0" encoding="utf-8"?>
- <!-- XML文件需以utf-8編碼-->
- <urlset>
- <!--必填-->
- <url>
- <!--必填,定義某一個鏈接的入口,每一條數據必須要用<url>和</url>來標示 -->
- <loc>http://www.xxxxxx.html/000000.html</loc>
- <!--必填,URL長度限制在256字節內-->
- <lastmod>2012-12-01</lastmod>
- <!--更新時間標簽,非必填,用來表示最后更新時間-->
- <changefreq>daily</changefreq>
- <!--更新頻率標簽,非必填,用來告知引擎頁面的更新頻率 -->
- <priority>0.8</priority>
- <!--優先權標簽,優先權值0.0-1.0,用來告知引擎該條url的優先級-->
- </url>
- </urlset>
2) XML標簽說明
標簽名稱 |
屬性 |
標簽說明 |
標簽類型 |
標簽限制 |
可選/必選 |
---|---|---|---|---|---|
changefreq |
/ |
標示數據更新頻率 |
字符串 |
有效值為:always、hourly、daily、weekly、monthly、yearly、never |
可選 |
lastmod |
/ |
標示數據最新一次更新時間 |
日期 |
時間格式為yyyy-mm-dd |
可選 |
loc |
/ |
標示該條數據的存放地址 |
url |
最小長度1個字符 |
必選 |
priority |
/ |
標示優先值 |
小數 |
[0.0 1.0](大于等于0小于等于1,保留一位小數)例如:< priority >0.8< priority > |
可選 |
url |
/ |
url地址的開始和結束 |
/ |
最多出現無限次 |
必選 |
urlset |
/ |
urlset用來標記整個文檔的開頭 |
/ |
/ |
必選 |
總結:Sitemap通常是有效的告訴蜘蛛,方便讀懂我們的網站內容,從而加大蜘蛛對我們網站的認可,對此,對于收錄問題上升是不容小視。