什么是 XML Sitemap?

XML Sitemap 是告诉搜索引擎网站有哪些可抓取 URL 的标准站点地图。

一、基础定义

XML Sitemap 是一份遵循 XML 格式 的文本文件,专门给搜索引擎(百度、谷歌、360 等爬虫)读取,用来告诉网站所有页面的清单、更新频率、优先级等信息,相当于给搜索引擎的全站导航目录
文件通常命名固定:sitemap.xml,一般放在网站根目录,访问地址如 shturl.cc/4WizfHi9oJUX7wJTz

二、核心作用

  1. 收录加速
    爬虫不一定能爬完网站所有页面(深层页面、内链少的页面容易漏抓),提交 sitemap 直接推送全部 URL,提升收录效率。
  2. 传递页面信息
    给搜索引擎补充页面权重、更新时间、更新频次,辅助爬虫判断抓取优先级。
  3. 适配大型网站
    商品站、资讯站、多分页站点页面成千上万,靠内链很难全部抓取,Sitemap 是批量提交页面的标准方案。
  4. 支持多类型资源
    除普通网页,还能单独生成图片地图、视频地图、新闻地图,让图片 / 视频内容参与搜索展示。

三、标准基础结构示例

 <?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <!-- 页面完整地址 -->
    <loc>https://www.example.com/</loc>
    <!-- 页面最后修改时间 -->
    <lastmod>2026-06-22</lastmod>
    <!-- 更新频率:always/hourly/daily/weekly/monthly/yearly/never -->
    <changefreq>daily</changefreq>
    <!-- 页面权重 0.1~1.0,首页建议1.0 -->
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://www.example.com/article/1.html</loc>
    <lastmod>2026-06-20</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

标签说明

  • <loc>:必填,页面完整规范 URL;
  • <lastmod>:可选,页面上次修改日期,方便爬虫判断是否重新抓取;
  • <changefreq>:可选,预估更新频率,仅作参考,不强制爬虫;
  • <priority>:可选,页面相对重要性,全站对比,不是排名分。

四、拆分方案:Sitemap 索引文件(sitemap index)

单个 sitemap.xml 最多只能放 5 万条 URL、文件≤50MB,大型网站需要拆分多个地图,用索引文件汇总:
sitemap-index.xml
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap-1.xml</loc>
    <lastmod>2026-06-22</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap-2.xml</loc>
    <lastmod>2026-06-22</lastmod>
  </sitemap>
</sitemapindex>

五、如何让搜索引擎发现 Sitemap

  1. robots.txt 声明(推荐)
    在根目录 robots.txt 添加一行,爬虫访问网站时自动读取:
Sitemap: https://example.com/sitemap.xml
  1. 搜索平台后台手动提交
  • 谷歌:Google Search Console
  • 百度:百度搜索资源平台
  • 360、搜狗:对应站长平台,填入 sitemap 地址提交

六、XML Sitemap 和 HTML 网站地图区别

类型XML SitemapHTML 网站地图
受众搜索引擎爬虫网站访客(用户)
格式XML 代码,浏览器打开是源码列表HTML 页面,带美观链接
用途优化收录、SEO 技术优化方便用户浏览全站栏目
存放根目录 sitemap.xml页面如 /sitemap.html

七、补充实用要点

  1. 只放可收录页面:排除 404、登录页、隐私页、Noindex 页面;
  2. URL 必须规范:统一 http/https、带 / 不带 www,避免重复 URL;
  3. 动态站点(商城、资讯、CMS)可程序自动生成,新增文章自动写入地图;
  4. 除通用网页地图,还有专用扩展:
    • Image Sitemap:图片收录、图片搜索展示
    • Video Sitemap:视频搜索卡片
    • News Sitemap:新闻资讯快速收录、新闻源展示
  5. 不会提升排名,只提升收录概率,页面排名仍靠内容、外链、内链等核心 SEO 因素。

开启您的项目

留下信息,我们将在 24 小时内与你沟通官网升级、AI 搜索适配与本地增长方案

📞
联系电话 18992800832
📧
电子邮箱 erfu1314@126.com
📍
办公地址 陕西省西安市唐延南路逸翠园i都会2号楼2单元320室
💬
客服微信 geo-cms-service 客服二维码

关注我们