有个做布料的外贸企业,建站时产品上传的文字内容几乎一模一样,不同系列的内容描述也只是更换了一个系列名称。
从用户角度看,80%的人会认为这家企业不太可靠,连网站都做的这么粗糙。从谷歌站内seo的角度,这样也是不行的。谷歌官方虽未明确说重复内容会带来任何惩罚或负面信号,但早已明确不会索引收录重复的内容。
一、什么是重复页面?
在seo业界都有这样的共识,url是页面的唯一标识符,类似身份证id一样,一个人只能有一个身份证id,如果出现了多了,这个人,多半是有问题的。同理,在搜索引擎当中,搜索引擎更加青睐标识符明确、并且唯一的页面。这样搜索引擎可以更好地理解你的网站。
为了避免不必要的抓取和索引工作,谷歌会尝试根据网站url来预测页面可能包含相似或重复的内容。当google抓取具有相似url的页面并发现它们包含相同的内容时,它随后可以确定具有该url结构的所有其他页面也具有相同的内容,进而将这些页面判定为重复页面,不予抓取收录。
二、重复页面较多,会有什么样的后果呢?
1、蜘蛛爬取网站的时间是有限的,过多的相同内容页面会消耗大量的抓取时间,加上后期搜索引擎会过滤重复页面,最终导致网站被索引的数量极少,后期排名更难做了。
2、链接到这些重复页面的链接权重被浪费,最终权重整体下降。
3、搜索引擎没办法了解哪个是你需要展示的页面,很有可能你不希望被抓取的页面反而被收录,最终展现给客户的页面不是特色页面,一定程度上减少了网站流量。
三、如何纠正此问题?
1、找到重复的页面
找到重复页面是很有必要的,可以使用siteliner以及copyscape这一类的工具为网站做一个系统的诊断,找到重复度非常高的页面,自己先做取舍,再让谷歌搜索引擎抓取、收录、排名。
2、301跳转
如果你有4组不同url但是内容相同,从url中选择一条标准的,将剩余的3组链接301跳转到第一个页面url上。因为301跳转属于带权重跳转,可以将4组url的权重统一。这样,搜索引擎不光可以识别唯一的页面,同时,唯一的那个页面也可以获得更好的排名。
总之,除了不可避免的重复以外,还是建议网站做成内容丰富且区别明显的页面,增加原创性的文章输出,让搜索引擎可以从网站上找到相关性高的各类信息。