影响Google谷歌搜索索引(index)的一些信号或者说因素


哪些信号会影响Google谷歌搜索索引(indexing)?

Robots.txt (爬虫协议) ✅

这个很好解释了,爬虫协议,爬虫会根据爬虫协议来爬取网站,如果爬虫协议不允许爬取,那么爬虫就不会爬取,索引也不会增加。

XML Sitemap ❌

XML Sitemap 只是告诉爬虫,哪些页面是需要爬取的,但是并不会影响索引。

Hreflang Tag ✅

Hreflang Tag 是一个信号影响索引,因为谷歌会根据Hreflang Tag来判断页面是否是多语言,其内容是否是重复的,如果发现重复的页面,那么就会选择其中一个页面来索引,其他页面就不会索引,如果是同一种语言,那么就会选择其中一个页面来索引,其他页面就不会索引。

Domain Age And History ❌

Domain Age And History 并不会影响索引,他只影响“我们的主观判断”,而机器人Bot不受影响!

Country ✅

Country 是一个信号影响索引,特定地区的用户搜索,符合该地区或者语言的内容,会有机会被索引。

Language ✅

毋庸置疑,语言也是一个信号影响索引,语言决定了用户搜索上下文所处的环境,用户在指定地区或者语言设置下,搜索符合该地区或者语言的内容是搜索引擎应该做的,所以会影响索引。

Matching Search Intent ❌

搜索意图是一个”很高级“的话题,但是他其实只是一个创作的信号,和bot抓取索引无关,毕竟还没抓取,从何谈起,符合用户意图被展示呢?(属于内容创作的范畴)

Core Web Vitals ✅

Core Web Vitals 是一个信号影响索引,因为谷歌会根据Core Web Vitals来判断页面是否是优质的,LCP,CLS,FID,TBT,INP,这几个
指标影响站点的用户体验,过于糟糕的用户体验,谷歌会降低索引的权重,

Dofollow Links 是一个信号影响索引,因为谷歌会根据Dofollow Links来考虑是否应该访问该页面,但是不是绝对的,这里有机会写个文章单独探讨下,各种情况下的优先级:Robots.txt,Dofollow Links,Meta NoIndex,AHref NoFollow.

Crawability ❌

Readability ❌

在抓取爬行阶段,可读性并不影响机器抓取,影响的只是人类阅读者,实际上他只想要访问纯文本(现在也会尝试解析图片上下文)。可读性不好,后续影响更大的可能是跳出率,间接导致页面权重降低。更有甚之,广告到处都是,不仅可读性差,页面性能也被拉低,消耗更多抓取预算

Content Depth and Comprehensiveness ❌

Content Recency and Freshness ✅

Keywords in H1 ❌

常年堆砌关键词在H1的做法还活在过去,他和索引八竿子打不着。

E-E-A-T(Expertise,Experience,Authority and Trust) ❌

最迷惑人的就是EEAT了,但是强调一点,这里讨论的是抓取索引,而不是 PR(恩?有人说EEAT是PR的信号吗,我没说过!)

Spam Policy Violations ✅

经常有人在讨论薄内容,垃圾内容,低质量内容,到底什么样的才是被 Brain Spam 标记后拒绝索引的?写的人知道。


文章作者: 2winter
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 2winter !
  目录