一、基础定义
XML Sitemap 是一份遵循 XML 格式 的文本文件,专门给搜索引擎(百度、谷歌、360 等爬虫)读取,用来告诉网站所有页面的清单、更新频率、优先级等信息,相当于给搜索引擎的全站导航目录。
文件通常命名固定:
sitemap.xml,一般放在网站根目录,访问地址如 shturl.cc/4WizfHi9oJUX7wJTz。二、核心作用
- 收录加速 爬虫不一定能爬完网站所有页面(深层页面、内链少的页面容易漏抓),提交 sitemap 直接推送全部 URL,提升收录效率。
- 传递页面信息 给搜索引擎补充页面权重、更新时间、更新频次,辅助爬虫判断抓取优先级。
- 适配大型网站 商品站、资讯站、多分页站点页面成千上万,靠内链很难全部抓取,Sitemap 是批量提交页面的标准方案。
- 支持多类型资源 除普通网页,还能单独生成图片地图、视频地图、新闻地图,让图片 / 视频内容参与搜索展示。
三、标准基础结构示例
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<!-- 页面完整地址 -->
<loc>https://www.example.com/</loc>
<!-- 页面最后修改时间 -->
<lastmod>2026-06-22</lastmod>
<!-- 更新频率:always/hourly/daily/weekly/monthly/yearly/never -->
<changefreq>daily</changefreq>
<!-- 页面权重 0.1~1.0,首页建议1.0 -->
<priority>1.0</priority>
</url>
<url>
<loc>https://www.example.com/article/1.html</loc>
<lastmod>2026-06-20</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
标签说明
<loc>:必填,页面完整规范 URL;<lastmod>:可选,页面上次修改日期,方便爬虫判断是否重新抓取;<changefreq>:可选,预估更新频率,仅作参考,不强制爬虫;<priority>:可选,页面相对重要性,全站对比,不是排名分。
四、拆分方案:Sitemap 索引文件(sitemap index)
单个
sitemap.xml 最多只能放 5 万条 URL、文件≤50MB,大型网站需要拆分多个地图,用索引文件汇总:
sitemap-index.xml<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-1.xml</loc>
<lastmod>2026-06-22</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-2.xml</loc>
<lastmod>2026-06-22</lastmod>
</sitemap>
</sitemapindex>
五、如何让搜索引擎发现 Sitemap
- robots.txt 声明(推荐)
在根目录
robots.txt添加一行,爬虫访问网站时自动读取:
Sitemap: https://example.com/sitemap.xml
- 搜索平台后台手动提交
- 谷歌:Google Search Console
- 百度:百度搜索资源平台
- 360、搜狗:对应站长平台,填入 sitemap 地址提交
六、XML Sitemap 和 HTML 网站地图区别
| 类型 | XML Sitemap | HTML 网站地图 |
|---|---|---|
| 受众 | 搜索引擎爬虫 | 网站访客(用户) |
| 格式 | XML 代码,浏览器打开是源码列表 | HTML 页面,带美观链接 |
| 用途 | 优化收录、SEO 技术优化 | 方便用户浏览全站栏目 |
| 存放 | 根目录 sitemap.xml | 页面如 /sitemap.html |
七、补充实用要点
- 只放可收录页面:排除 404、登录页、隐私页、Noindex 页面;
- URL 必须规范:统一 http/https、带 / 不带 www,避免重复 URL;
- 动态站点(商城、资讯、CMS)可程序自动生成,新增文章自动写入地图;
- 除通用网页地图,还有专用扩展:
- Image Sitemap:图片收录、图片搜索展示
- Video Sitemap:视频搜索卡片
- News Sitemap:新闻资讯快速收录、新闻源展示
- 不会提升排名,只提升收录概率,页面排名仍靠内容、外链、内链等核心 SEO 因素。