作为SEO从业人员,主要的工作内容是优化网站排名以取得更多、更精准的流量,因此理解搜索引擎的排名机制,是做好SEO优化的前提。
但”理解排名机制”不等于背诵一张200条的排名因素清单。事实上,网上流传的各种”200个排名因素”列表大多真假参半——有些是Google官方确认的,有些是从业者的经验共识,还有很多纯粹是猜测甚至已经过时的信息。
这篇文章不做清单罗列。我会从排名的底层机制出发,拆解真正在起作用的核心信号,同时纠正中文SEO圈几个流传很广的误区。
排名的底层逻辑
谷歌排名的本质可以概括为一个概率判断:
P(Satisfied | Page, Query)
也就是说,Google在评估”当用户搜索某个词时,这个页面让用户满意的概率有多大”。概率越高,排名越高或越稳定。
这个概率取决于两个维度的信号交汇,用David Quaid的框架来表述:
Authority × Relevance = Ranking
Relevance解决的是”你的内容跟这个查询有多相关”。Authority解决的是”Google有多大理由信任你的网站来回答这个查询”。两者缺一不可——没有Authority的高相关内容排不上去(新站困境),没有Relevance的高权威站也排不了不相关的词。
如果你不确定如何系统化推进这两个维度的优化,鸭老师的谷歌SEO服务可以从诊断到执行帮你完成整套方案。
Google的排名管线:两套系统在赛跑
Google的排名不是一步到位的,而是由两套系统分阶段完成的(这个管线结构在DOJ反垄断审判中被证实):
Relevance Systems(快速系统)——负责”发现”你。核心依赖两个信号:页面与查询的主题相关性(Google API泄露文档中对应的属性包括siteFocusScore和siteRadius),以及用户交互带来的流行度评分(由NavBoost系统驱动,测量点击、滚动和”最后最长点击”)。
Quality Systems(慢速系统)——负责”审判”你。核心是一个站点级别的、与具体查询无关的信任评分,PageRank(对应API泄露中的Homepage PageRank和PageRankPerDocData)是这个评分中的一个关键属性。此外还有一系列负面过滤器:spamrank(垃圾链接评分)、scamness(欺诈/信任缺失评分)、pandaDemotion(内容质量降权)、navDemotion(导航类降权)等。这些过滤器不会帮你排上去,但会把你拉下来。
这两套系统的时间差解释了一个常见现象:新站或新页面有时能短期排上去,但过一段时间又掉了。这不是”沙盒期”这个模糊概念能解释的——真正发生的是Relevance Systems先让你进入排名池,但Quality Systems随后用信任天花板把你压了下来。
新站前期必须做外部链接建设,根本原因就在这里——不是为了”投票”这种比喻,而是为了提升站点级信任评分,否则Relevance Systems给你的排名机会会被Quality Systems持续压制。
排名因素是上下文相关的
在进入具体因素之前,需要先说清楚一个大前提:不存在一套普适的排名因素权重清单。
这也是Google的John Mueller被问到任何SEO问题时永远回答”it depends”的根本原因——Shaun Anderson和David Quaid在2026年将这个概念正式定义为”Contextual SEO”。
同一个排名信号,在不同的查询上下文中权重完全不同。决定”上下文”的几个层级,从上到下:
查询类型——用户搜索的是信息(Know)、操作(Do)、导航(Website)还是本地(Visit-in-Person)?SERP的形态直接告诉你Google认为这个查询需要什么类型的页面。
风险等级——这个查询涉及YMYL(Your Money or Your Life)吗?Google API泄露文档中有专门的分类器——ymylHealthScore针对医疗健康内容打分,ymylNewsScore针对新闻类内容打分。如果你的内容落在这些高风险分类里,Google对信任信号的阈值要求远高于娱乐内容。
实体角色——你的网站在这个查询中扮演什么角色?品牌、出版商、独立个人、工具、论坛还是零售商?API泄露中的isMerchant标识电商实体,isLargeChain标识连锁品牌,queriesForWhichOfficial标识官方来源——Google在精确分辨你是谁。一个CNC加工服务商去排”CNC machining tutorial”(教程类查询),跟一个教育博客去排同一个词,Google的期望完全不同。
这意味着什么? 意味着你在优化任何页面之前,第一步应该是去搜索目标关键词,看SERP上排的是什么类型的页面、什么类型的网站。如果排在前面的全是Amazon和零售巨头,你一个B2B供应商硬刚这个词就是上下文越界(Contextual Overreach)——不是你内容不够好,而是你的实体角色跟查询预期不匹配。
Anderson提出了一个非常实用的自检问题:
Quality Rater是否会合理地期望这个实体为这个查询提供这种类型的页面?
答案是”不期望”的,就不该做。做了不是加分,是浪费资源。
真正影响排名的核心因素
1. 搜索意图匹配
这是所有排名因素的前提——如果你的页面跟用户的搜索意图不匹配,其他一切优化都是无效的。
搜索意图就是用户在搜索框里输入那几个词时,心里真正想要什么。搜索”跑鞋”的用户大概率想买,这是交易型意图;搜索”跑鞋怎么选”的用户想要选购指南,这是信息型意图。你的页面类型必须跟意图匹配——用一篇品牌故事去排一个交易型关键词,不管内容写得多好都排不上去。
判断意图的最可靠方法不是猜,而是直接去Google搜索目标关键词,看排在前面的页面是什么类型(产品页、博客、论坛还是视频)、什么格式(教程、清单、对比还是评测)、什么深度。然后对齐这个标准来组织你的内容。
2. 站点权威性与外链
权威性对应的是Authority × Relevance公式中的Authority维度,也是Quality Systems中站点级信任评分的核心来源。API泄露文档中,权威性相关的属性集中在siteAuthority、Homepage PageRank、PageRankPerDocData、authorityPromotion等。
权威性的来源有两个:
外链(外部链接)——其他网站通过锚文本、图片链接或裸链接指向你的网站。高质量、与你行业相关的外链无论dofollow还是nofollow都有价值——dofollow传递PageRank,nofollow也能带来流量和品牌曝光。外链的价值判断要看referring domain(引用域名数),而不是只看链接总数量。100个不同网站各给你一条链接,远比一个网站给你100条链接有价值。
延伸阅读:获取高质量外链
站内信号积累——通过持续产出满足用户搜索意图的内容,积累用户交互数据(NavBoost),从而在Relevance Systems中建立存在感。API泄露中的contentEffort(内容生产投入度)和originalContentScore(原创内容评分)也在衡量你是在认真做内容还是在批量灌水。
值得注意的是,API泄露中还有一个unauthoritativeScore属性——如果你的网站声称自己是权威来源但缺乏外部佐证,这个分数会上升。这就是为什么单靠站内优化不够,必须有外部链接和引用来支撑你的权威性声明。
3. 内容质量与生产投入
Google无法直接判断文字内容的”质量”——”质量”是一个抽象的概括术语。实际起作用的是一系列可量化的信号。
从Relevance Systems的角度,核心是用户行为:用户是否在你的页面上完成了搜索任务(终止型满足,即用户无需再返回搜索结果)、停留时间、页面间浏览行为、pogo sticking率等。这些通过NavBoost系统汇总。
从Quality Systems的角度,Google在衡量你的内容生产投入。API泄露文档中明确存在contentEffort这个属性——它不是在看你写了多少字,而是在评估你在这个页面上投入了多少真实的生产努力。原创图片(docImages)、实质性的内容更新(lastSignificantUpdate)、可归属到具体作者的内容(isAuthor)都是正向信号。反过来,大量生产的AI内容如果没有人工编辑和真实经验注入,originalContentScore会很低。
这里有一个关键判断:内容的深度应该跟查询预期成比例,而不是越多越好。
如果用户搜的是”什么是CNC加工”,他需要一个清晰的定义和基本原理说明。你在这个页面里硬塞”CNC加工的历史演变””各国机床品牌对比””材料科学原理”等用户并不期望看到的内容,不是在增加”全面性”,而是在制造意图漂移(Intent Drift)——页面可能短期匹配上一些边缘查询,但这些查询你实际不满足,最终会被Quality Systems纠正。更糟的是,这些多余内容稀释了页面跟核心查询的相关性,连本来应该排的词也排不好。
很多人管这种硬塞内容的做法叫”做信息增量”。实际效果恰恰相反——脱离查询上下文的内容扩展就是上下文越界(Contextual Overreach),会主动伤害排名。正确的做法是动笔前先看SERP上排在前面的页面覆盖了哪些子话题、用什么深度,然后对齐这个预期——不多不少。
4. 主题权威(Topic Authority)
是否围绕同一主题形成了内容集群,直接影响Google对你网站在该领域的专业度判断。API泄露文档中有一组属性专门衡量这个维度:siteFocusScore(站点主题聚焦度)、siteRadius(站点主题覆盖半径)、site2vecEmbeddingEncoded(站点向量化编码——Google把你的整个网站编码成一个语义向量,看你到底在讲什么)。
反过来,如果一个做牙科服务的网站突然发布了一批加密货币相关内容,siteFocusScore会被稀释,整个站点在牙科领域的专业度也会受损。Anderson将这种行为称为”Stay in Your Lane”——保持在你的赛道上。
操作层面:
建立清晰的pillar page + 支撑页面结构——围绕核心主题建一个支柱页面,然后用多篇支撑文章从不同角度深入展开子话题。可以借助fan-out query(扇形查询)的方式来规划内容矩阵。
内链围绕主题构建——支撑页面链接到pillar page,pillar page也要链接回各支撑页面。内链不是”随机互链”,每一条链接都应该在主题上说得通。按照David Quaid的框架,每个源页面的出站内链控制在3条以内,集中传递权重。
不属于核心主题的内容要处理——要么301重定向合并到相关页面,要么直接删除,要么迁移到别的域名。不要为了追热点流量去稀释你的主题聚焦度。
5. 用户交互信号(NavBoost)
用户在你的页面上产生的所有交互行为都是信号:点击、滚动、停留、发送询盘、加购、结账、观看视频、点击链接、留下评论、打评分等。这些信号通过NavBoost系统被Google大规模采集和利用——这已经不是猜测,而是DOJ审判中被证实的事实。
NavBoost测量的核心指标之一是”last longest click”——如果用户在搜索结果中点了你的页面后不再返回搜索结果,或者在你的页面上停留时间最长,这就是一个强烈的满意信号。API泄露中对应的属性包括GoodClicks和BadClicks——Google在精确地区分哪些点击是满意的、哪些不是。
需要用谷歌分析工具来追踪和优化这些用户行为数据。重点关注:跳出率高的页面(可能意图不匹配)、停留时间短的页面(可能内容不满足需求)、以及用户在哪些页面产生了转化行为。
6. 实体与品牌信号
Google通过知识图谱来理解实体——搜索一个人名或品牌名时出现的知识面板,就是多个实体属性节点组合成的结果。API泄露中的EntityAnnotations和onsiteProminence就是Google用来识别和评估页面中实体信息的属性。
你的网站需要跟你在互联网上所有的品牌信息关联起来:社交媒体账号、行业目录、权威平台上的个人简介等。这些站外信号帮助Google消除实体歧义(entity disambiguation),确认”你是谁”以及”你在什么领域有发言权”。
操作要点:站内通过Schema/JSON-LD标记(Person、Organization等)声明实体信息,sameAs属性指向你在各平台的profile页面。但要注意——实体膨胀(Entity Inflation):如果你在Schema里把自己标记为一个大型机构,但实际上没有任何外部平台佐证这个身份,这种包装跟实际不符的做法反而会制造信任摩擦。Google排的是你能被合理解读为什么,不是你声称自己是什么。
另一个值得关注的属性是queriesForWhichOfficial——Google会判断你的网站对于哪些查询是”官方来源”。要成为某个查询的官方来源,需要持续在该领域建立可验证的品牌存在感,而不只是在Schema里声明。
7. 页面On-Page优化基础
这些是页面级别的相关性信号,单独来看每个因素权重不大,但它们共同构成了Google理解你页面主题的基础:
标题标签(Title Tag)——关键词出现在标题中仍然是重要的相关性信号,建议将主要关键词前置。
元描述(Meta Description)——不直接影响排名,但影响点击率(CTR),而点击率通过NavBoost系统间接影响排名。元描述与搜索意图的匹配程度越高,越能被点击。
H标签层级——H1、H2、H3中出现关键词或相关短语,帮助Google理解页面结构和各段落的主题。John Mueller确认过HTML标题标签帮助Google理解页面结构。
URL结构——简短、包含关键词、层级不超过四层的URL比长而复杂的动态URL更有利于理解和索引。
图片优化——压缩体积保持画质,alt属性用自然语言描述图片内容并包含相关关键词。API泄露中docImages作为内容生产投入的信号之一,说明原创图片比没有图片的纯文字页面多一个正向信号。
8. 页面体验与技术基础
Google官方确认网页速度是排名因素,具体通过Core Web Vitals来衡量。2024年之后核心指标从FID替换为INP(Interaction to Next Paint),要求优化至200ms以下。
除了速度,还包括移动友好性、HTTPS安全性、以及页面可用性。API泄露文档中的clutterScore专门衡量页面上是否有干扰用户的元素(侵入式广告、弹窗等),badSslCertificate标识SSL证书问题。这些都是负面信号——不会帮你排上去,但出问题会直接拉你下来。
移动端体验尤其重要。在手机上加载你的网站,如果广告遮挡了主要内容、字体太小需要缩放、按钮太小难以点击——这些都在推高clutterScore,用广告收入的蝇头小利换排名位置的巨大损失。
延伸阅读:优化WordPress网站速度
9. 内链架构与权重分配
内链的作用不只是”帮助页面被发现和索引”——更重要的是权重分配。通过内链将权重从高权重页面集中传递到money page,可以显著提升目标页面的竞争力。
内链建设的原则:每条内链在主题上必须说得通(不要随机互链),锚文本自然且相关,每个源页面的出站内链数量控制在合理范围内避免权重过度稀释。API泄露中存在anchorMismatchDemotion属性——如果锚文本跟目标页面内容不匹配,不但没有正向作用,还会触发降权。
同时要定期清理坏链和死链——可以用Screaming Frog、Ahrefs等工具诊断,将404链接修复或移除。
10. 出站链接与引用
出站链接指向相关主题的高质量权威网站,对搜索引擎定位你的页面主题有辅助作用。Google会将你出站链接指向的页面内容作为相关性判定的参考信号。
操作建议:每篇英文内容保持3-6条出站链接指向高权威来源(行业权威网站、学术机构、官方文档),使用自然锚文本,不加nofollow(除非是affiliate链接或付费合作)。引用Reddit讨论和YouTube视频作为Experience信号也是有效的做法。
11. 信任信号与风险控制
这是排名管线中Quality Systems的核心过滤层。API泄露文档中,信任相关的属性几乎全是负面/降权类:pandaDemotion、navDemotion、serpDemotion、spamrank、scamness、clutterScore、anchorMismatchDemotion、badSslCertificate、forwardingdup等。
这意味着信任不是一个”加分项”——而是一个”不出问题就不扣分”的过滤器。你不需要”提升信任度”,你需要的是不触发负面信号:
你的内容生产方式是否跟你网站声称的定位一致?如果”关于我们”页面写着”行业专家团队”,但实际产出的是大量未经编辑的AI生成内容,这种不一致在Quality Rater评估中属于”Deceptive Page Purpose”(欺骗性页面目的),在API层面可能触发scamness上升。
你的网站是否在收集用户的钱或个人信息?只要涉及信用卡支付,你自动进入YMYL范畴。退款政策、联系方式、物理地址、客服渠道的缺失会直接推高scamness评分。API泄露中的brickAndMortarStrength甚至在衡量你是否有实体经营场所。
你的affiliate链接是否透明披露?隐藏affiliate链接被Google视为欺骗性变现,会推高scamness和spamrank。
常见误区
LSI(潜在语义索引)
Google不使用LSI。John Mueller已经多次明确否认。LSI是1988年提出的信息检索技术,Google使用的是基于BERT和其他神经网络模型的语义理解,二者在技术原理上完全不同。
“多用近义词和相关词”这个建议本身没错,但理由不是LSI——而是自然语言本身就会在讨论一个话题时使用相关词汇。你不需要刻意去”做”LSI,用自然的方式写清楚你要讲的内容就够了。
关键词密度存在最优区间
没有任何Google官方来源支持”关键词密度保持1%-3%”或任何具体百分比。这是SEO行业早期遗留的伪概念。
关键词当然需要出现在标题、H标签、正文等位置以建立相关性,但不需要计算密度。自然写作,把话说清楚,关键词该出现的地方自然会出现。
域名年龄直接影响排名
Google的John Mueller明确表示域名年龄与排名没有直接关系。老域名确实比新域名更容易排名,但原因不是”年龄”本身,而是年龄背后的积累效应——持续产出有价值的内容、获取外链、积累用户交互数据,站点信任评分自然比新域名高。但如果这些年产出的全是垃圾内容,时间越长惩罚越重。
内容越全面越好
很多人为了”做出差异化”,在一篇主题明确的文章里硬塞大量跟核心查询无关的延伸内容。实际效果恰恰相反——脱离查询上下文的内容扩展同时触发上下文越界(Contextual Overreach)和意图漂移(Intent Drift),会主动伤害排名。
正确的做法是:内容深度匹配查询预期,不多不少。如果你有竞品没覆盖到但用户确实需要的信息,加进去是合理的;但如果只是为了”显得全面”而硬塞无关内容,结果是排名更差而不是更好。
其他值得关注的信号
内容时效性——定期审查和更新内容。API泄露中的lastSignificantUpdate衡量的是最后一次实质性更新,不是改个年份数字。Google关注的是更新的实质幅度——添加或删除一个完整段落算更新,改几个错别字不算。
重复内容处理——有重复内容的页面要么301重定向合并,要么使用canonical标签指定规范版本。API泄露中forwardingdup和ContentChecksum96都在追踪内容重复问题。
多媒体——图片、视频、表格等形式有助于提升用户阅读体验和停留时间,也是contentEffort的正向信号。
优质页面占比——你的网站中高质量页面占总页面数的比例越高,整体站点质量评分越好。100个页面中30个是优质页面,比100个页面中只有10个优质页面的站点表现更好。这也是为什么内容修剪(content pruning)——删除低质量页面——有时反而能提升整站流量。
独立Google SEO专家,ylsseo.com创始人,基于Google专利与API Leak解读排名机制,中文SEO启蒙第一人。