哪些信号会影响Google谷歌搜索索引(indexing)?
Robots.txt (爬虫协议) ✅
这个很好解释了,爬虫协议,爬虫会根据爬虫协议来爬取网站,如果爬虫协议不允许爬取,那么爬虫就不会爬取,索引也不会增加。
XML Sitemap ❌
XML Sitemap 只是告诉爬虫,哪些页面是需要爬取的,但是并不会影响索引。
Hreflang Tag ✅
Hreflang Tag 是一个信号影响索引,因为谷歌会根据Hreflang Tag来判断页面是否是多语言,其内容是否是重复的,如果发现重复的页面,那么就会选择其中一个页面来索引,其他页面就不会索引,如果是同一种语言,那么就会选择其中一个页面来索引,其他页面就不会索引。
Domain Age And History ❌
Domain Age And History 并不会影响索引,他只影响“我们的主观判断”,而机器人Bot不受影响!
Country ✅
Country 是一个信号影响索引,特定地区的用户搜索,符合该地区或者语言的内容,会有机会被索引。
Language ✅
毋庸置疑,语言也是一个信号影响索引,语言决定了用户搜索上下文所处的环境,用户在指定地区或者语言设置下,搜索符合该地区或者语言的内容是搜索引擎应该做的,所以会影响索引。
Matching Search Intent ❌
搜索意图是一个”很高级“的话题,但是他其实只是一个创作的信号,和bot抓取索引无关,毕竟还没抓取,从何谈起,符合用户意图被展示呢?(属于内容创作的范畴)
Core Web Vitals ✅
Core Web Vitals 是一个信号影响索引,因为谷歌会根据Core Web Vitals来判断页面是否是优质的,LCP,CLS,FID,TBT,INP,这几个
指标影响站点的用户体验,过于糟糕的用户体验,谷歌会降低索引的权重,
Dofollow Links ✅
Dofollow Links 是一个信号影响索引,因为谷歌会根据Dofollow Links来考虑是否应该访问该页面,但是不是绝对的,这里有机会写个文章单独探讨下,各种情况下的优先级:Robots.txt,Dofollow Links,Meta NoIndex,AHref NoFollow.
Link Velocity ❌
Crawability ❌
Logical internal links ❌
Readability ❌
在抓取爬行阶段,可读性并不影响机器抓取,影响的只是人类阅读者,实际上他只想要访问纯文本(现在也会尝试解析图片上下文)。可读性不好,后续影响更大的可能是跳出率,间接导致页面权重降低。更有甚之,广告到处都是,不仅可读性差,页面性能也被拉低,消耗更多抓取预算。
Content Depth and Comprehensiveness ❌
Content Recency and Freshness ✅
Keywords in H1 ❌
常年堆砌关键词在H1的做法还活在过去,他和索引八竿子打不着。
E-E-A-T(Expertise,Experience,Authority and Trust) ❌
最迷惑人的就是EEAT了,但是强调一点,这里讨论的是抓取索引,而不是 PR(恩?有人说EEAT是PR的信号吗,我没说过!)
Spam Policy Violations ✅
经常有人在讨论薄内容,垃圾内容,低质量内容,到底什么样的才是被 Brain Spam 标记后拒绝索引的?写的人知道。