专栏作家帕特里克·斯托克(patrick stox)概述何时使用规范标签,以及实施过程中发生的一些常见问题。
网站优化
在理想的世界中,每个页面只能有一个版本。太糟糕了,世界是凌乱的,同一个网站和其他网站上的多个地点都可以存在相同的内容。多年以前,采用了一种解决方案来帮助这些重复的内容问题:“规范链接元素”,更被称为“rel = canonical”或“canonical标签”。
标准标签如何帮助seo?标准标签通过设置页面的首选版本并传递信号(例如链接到首选版本)来帮助解决重复的内容问题。该标签有助于整合由以下问题引起的重复内容:
http和httpswww和非www参数和面导航会话id尾部斜杠索引/默认页面替代页面版本,如m。或amp页面或打印版本在哪里添加规范大多数seo都知道您可以在头部使用规范标签,例如:
<link rel=canonical href=https://example.com/ />
您可能不会意识到,也可以在http标头中设置规范标记,例如:
http/1.1 200 ok
link: <https://example.com/>; rel=canonical
标题中的规范可以用于任何页面,但最常见的用例是为pdf设置首选版本,就像google在丹麦劫持google seo入门指南时所做的那样。
“我的规范标签不工作”规范标签不是指令,这意味着它可以被忽略。规范版本是网站地图中应该使用的页面的版本,例如,在站点地图中或整个内部链接中都有冲突的url 可能会引发混合信号。如果页面不够紧密匹配,也可以忽略规范标签。
其他事情可能会出错,例如复制页面,而不是更改规范标签,或者在“改变我”或“替换我”的规范中留下一个占位符。你还应该使用规范中的绝对 – 不是相对路径的url来帮助避免错误。这些和自我引用的规范标签可能导致多个页面基本上告诉搜索引擎他们是首选版本,这是没有意义的。如果该页面有多个不同的规范标签,那么google将忽略这两个标签。
如果有刚刚提到的混合信号,google会做什么?他们将尝试使用各种信号(如建议的规范,内部链接和网站地图url)确定最佳网址,但也有其他因素。例如,他们可能尝试通过较长的url选择较短的url或通过http选择https。
google倾向于通过等同的http页面进行https页面的标准化,除非出现如下所示的冲突信号(根据google search console帮助文档中的使用规范网址页面):
https页面的ssl证书无效。https页面包含不安全的依赖关系。https页面被机械化(并且http页面不是)。https页面将用户重定向到或通过http页面。https页面具有到http页面的rel =“canonical”链接。https页面包含noindex漫游器元标记一个罕见的情况,但肯定是可以发生的,是编码错误导致头部分结束之前应该。在这种情况下,规范可能实际上在身体内容中,哪里不被搜索引擎所尊重。更糟糕的是,大多数工具(如尖叫青蛙或深度抓取)或甚至通过查看源代码都不会检测到此问题。只有通过查看dom(文档对象模型)本身(例如使用inspect for chrome开发工具 ?),才能识别这个问题。
例如,在下面的图片中查看home depot的标准标签,您将看到头部已经结束 – 当查看源时,头部出现的大部分内容实际上在查看dom。
网站优化
canonical与其他标签的互动一个典型的标签可以很容易地错误的一个小东西,如拼写错误或尾随斜线,特别是在一个集合,如分页或hreflang。在这些集合中,具有与标签中包含的页面不同的页面将导致一组页面不会按照应用程序进行合并,例如将分页集的第2页的规范设置为第1页的url。noindex标签和规范也不应该一起使用。我看到了典型标签似乎将noindex传递到首选版本的实例。
规范标签的其他用途你知道规范标签可以在不同的域使用吗?这实际上是聚合内容时使用的首选方法。您还应该将您的网站的备用版本(例如移动或amp版本)规范化为主。根据google的说法,google更好的是,您不需要更改即将推出的首个移动设备索引的规范标签。
在理想世界中,规范是不需要的虽然规范可用于整合多个页面的信号,但请记住,在理想世界中只有一个版本。从长远来看,使用其他方法(如重定向)整合页面更好,因为您可以希望能够访问单个可访问版本的页面。