SEO优化-sitemap站点地图
详细介绍Sitemap的语法规则和搜索引擎搜录方法。
什么是Sitemap
Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于搜索引擎发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供搜索引擎Spider参考。
支持的文件格式
搜索引擎支持的文件格式一般有:
txt
此文本文件需要遵循以下指南:
文本文件每行都必须有一个网址。网址中不能有换行
不应包含网址列表以外的任何信息
您必须书写完整的网址,包括 http
每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件
文本文件需使用 UTF-8 编码或GBK编码。
1 | http://www.example.com/repaste/101562698_5230191316.html |
xml
单个xml数据格式如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
<!--必填标签-->
<url>
<!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->
<loc>http://www.yoursite.com/yoursite.html</loc>
<!--必填,URL链接地址,长度不得超过256字节-->
<lastmod>2009-12-14</lastmod>
<!--可以不提交该标签,用来指定该链接的最后更新时间-->
<changefreq>daily</changefreq>
<!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->
<priority>0.8</priority>
<!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->
</url>
<url>
<loc>http://www.yoursite.com/yoursite2.html</loc>
<lastmod>2010-05-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>若有多条url,按照上述格式重复
之间的片断,列明所有url地址,打包到一个xml文件
注意事项
一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。
一个站点支持提交的sitemap链接个数必须小于5万个,多于5万个后会不再处理,并显示“链接数超”的提示。
自动生成工具
在 Hexo 博客中生成 Sitemap 可以帮助搜索引擎更高效地抓取和索引您的网站内容。以下是设置和生成 Sitemap 的步骤。
- 安装插件:
1 | npm install hexo-generator-sitemap --save |
- 修改配置文件
打开 Hexo 的主配置文件 _config.yml。
添加以下内容:
1 | sitemap: |
确保配置文件中的 url 和 root 设置正确,因为 Sitemap 会根据这些生成完整链接。
- 生成 Sitemap
执行以下命令生成站点:
1 | hexo clean && hexo generate |
在 public 文件夹中,您将看到生成的 sitemap.xml 和(如果安装了百度插件)baidusitemap.xml 文件。
提交到搜索引擎
Google: 登录 Google Search Console,添加您的网站并提交 sitemap.xml。百度: 登录 百度站长平台,验证网站后提交 sitemap.xml。
以百度为例,百度提供快速抓取、普通收录功能,普通用户使用普通收录功能即可,主动向搜索引擎提交数据。

SEO优化-sitemap站点地图

