解决未索引页面的最佳实践
未能对网站上的页面建立索引意味着该页面在搜索引擎上不可见。有几个原因可以解释这一点,例如页面上存在阻止其探索的错误。它还可以是已爬网但未编入索引的页面。
搜索引擎必须能够找到(发现)并抓取(爬行)页面才能对其建立索引。然而,这并不系统地意味着它将被索引。然后我们谈到“已爬行的、当前未索引的”页面。
但发现和爬行可能会因以下几种情况而被阻止:阻止 URL、重定向、服务器错误、找不到页面等。另一方面,当页面在没有被索引的情况下被抓取时,这意味着搜索引擎发现并抓取了该页面,但决定不对其建立索引。这种情况,一般是内容质量相关的问题。不过,好消息是,搜索引擎提供免费工具来检测这些索引问题。
以下是针对非索引页面可用的解决方案。当然,谷歌是世界上使用最多的搜索引擎,我们会对它及其工具谷歌搜索控制台更感兴趣。
带有“性能”、“内容”、“排名”、“爬行”和“优化”等相关关键词的 SEO 插图,代表自然引用提高在线可见度的不同方面。
索引网站页面:定义
对网站页面建立索引意味着这些 如何建立电话号码清单 页面在搜索引擎的搜索结果(SERP,搜索引擎结果页面)中可见,从 Google 开始。换句话说,非索引页面不会出现在搜索结果中。这意味着用户无法以这种方式访问它。如果大量页面受到影响,您可以想象非索引很快就会成为一个问题。
事实上,索引是在网站每个页面的级别完成的,而不是在网站本身的级别完成的。此外,非索引页面的内容无法提高网站的整体权威性和主题相关性。
然而,索引并不一定能保证流量,因为一个页面可以被索引,但引用却很差。这样它就不太明显,吸引的流量也更少。
在所有情况下,解决此索引问题都很重要。但我们还需要找出原因!
网络研讨会
在 Google 上排名第一的所有秘诀
观看网络研讨会!
未建立索引的原因及未建立索引页面的解决方案
网站上的页面无法编入索引的原因有多种。这可能是页面上的错误或问题,或者正如我们所见,Google 选择不为页面建立索引。
可以肯定的是,必须找出这些原因,以便为未索引的页面提供正确的解决方案。
页面索引“错误”及解决方案
此错误列表并不详尽,因为可能存在其他原因。然而,如果是自愿指导的话,并非所有这里提出的“问题”都是系统性问题。
例如,并非网站上的所有页面都需要建立索引。在这种情况下,URL 被“noindex”标签屏蔽是正常的。
> URL 被 robots.txt 文件阻止
提及被robots.txt 文件阻止的 URL表明相关文件中存在阻止搜索引擎访问受影响页面的规则。换句话说,该页面已被您网站的 robots.txt 文件阻止(“不允许”页面)。
解决方案 :从受影响的页面中删除 robots.txt 块。要验证文件,请输入您的站点地址,后跟“/robots.txt”,如下例所示: https: //www.example.com/robots.txt
robots.txt 文件的屏幕截图,显示多个“禁止”指令,阻止搜索引擎访问网站上的某些页面。
请注意,Google 已澄清该指令实际上不受支持。因此,从搜索结果中排除页面的最佳方法是仅使用“noindex”标签。
>与重定向相关的索引错误
与重定向相关的错误可以有多种类型:
重定向链太长;
重定向循环(重定向链中的链接之一被重定向到已经是该链一部分的 URL);
最终超过最大 URL 长度的重定向 URL;
重定向链中的 URL 不正确或为空。
解决方案 :只需相应地纠正重定向,例如,通过限制重定向链的大小。在线工具允许您检查页面重定向。
>标记为“noindex”的 URL
提及标记为“ noindex ”的 URL 表示网站上存在该页面的非索引指令。该函数正是用于阻止我们不希望被索引的页面。
这是一个错误,您的页面应该被索引吗?请注意,所有网站管理平台(WordPress、Shopify 等)都允许您直接在相关页面上解决问题。例如(下图),您必须转到 WordPress 相关页面底部的“高级”。
页面索引设置的屏幕截图,允许您选择是否应在搜索结果中显示内容。
> 401 或 403 类型错误
页面可能由于未经授权的请求(401 错误)或访问拒绝(403 错误)而被阻止。这意味着网络爬虫无法访问该页面,因为请求了访问凭据(401) 或对所请求资源的访问受到限制 (403)。
在这里,我们建议您自行测试 URL,以确保您收到权限请求。然后通过在隐私浏览中访问受影响的页面来检查错误。如果您可以在未经许可的情况下访问网址,这可能意味着网站管理员在尝试保护网站免受抓取工具侵害时阻止了 Google。
解决方案 :删除访问凭据或允许 Googlebot 通过验证其身份来访问您的网页。
> 404 类型错误
404 错误表示即使 Google 通过抓取您的网站或其他网站找到了相关页面的 URL,也无法找到该页面。
这可以通过以下事实来解释:该页面不再存在,但指向该页面的链接仍然存在。如果该页面确实存在,则指向该页面的链接可能存在错误。
解决方案 :如果这是错误,请更正 须主动创建越来越优质的内 链接。如果该页面不再存在,则进行301(永久)重定向到处理同一主题的另一个页面。事实上,不可能要求 Google 忽略 404 错误。此外,404 错误还会损害您网站的 SEO。
> 500 类型错误
500错误表明站点服务器 在请求页面时返回了“站点暂时无法访问”消息。
通常,此错误是由服务器维护或与站点流程不直接相关的技术问题引起的。因此,这是暂时的,没有什么可做的。
然而,有时它可能是您所执行的操作的结果。
解决方案 :如果错误 500 随着时间的推移仍然存在,请删除刚刚安装的新插件、主题、应用程序或扩展,特别是如果在将新组件集成到站点后出现错误 500。另请确保在重新加载页面之前清除浏览器缓存,以检查问题是否已解决。
>提及“具有正确规范标签的另一页”
引用“具有正确规范标签的另一页面”指示该页面被标记为另一页面的替代版本,因此链接到所述源。
这种情况是正常的,因为这正是规范标签的作用。它特别用于电子商务,当他们为产品的每个变体提供一页时(例如,蓝色毛衣一页,同一毛衣但红色一页)。这允许您拥有重复或几乎相似的内容而不会受到惩罚。
为电脑设计的页面和为手机导航设计的AMP页面原理是一样的。综上所述,无需采取任何行动!
>链接到重复页面的错误
当网站包含重复页面时,可能会出 CMO 电子邮件列表 现两种类型的消息:
没有用户选择的规范 URL 的重复页面问题 :此页面是另一个页面的重复,并且 Google 已选择另一个页面作为规范 URL(首选页面),因为您尚未设置规范标签;
Google 选择了用户以外的规范 URL 的重复页面问题:Google 认为另一个 URL 是比用户选择的规范版本更合适的规范版本。