信息增益（information Gain）专利，不是影响排名的因素

“信息增量”(information gain)是个真实的技术量,被 SEO 圈一层层掏空,最后变成了”你的文章要比别人多提供一点独特价值”这种口号。它不是谷歌的排名因素。下面是一手来源,和它一步步变味的过程。

它的真身:信息论里的一个精确量

“信息增量”不是 SEO 发明的词。它源于 Shannon 熵,指熵的期望下降量 / 互信息——一个有严格数学定义的量。机器学习里,决策树算法(ID3、C4.5)用它做特征选择:衡量某个特征能把数据的不确定性降低多少。

记住这一点:这个词自带”硬核”光环。后面所有的改头换面,都在借这个光环。

谷歌专利实际写的是什么

SEO 圈拿来当证据的,是谷歌 2018 年申请的专利《Contextual estimation of link information gain》(发明人 Victor Carbune、Pedro Gonnet)。我直接读了授权版 US12013887B2 的全文。它确实是个”打分 + 排名”的提案,但专利里每一句排名表述都挂着 “may”——原文:”these search results may be ranked at least in part based on their respective information gain scores”。要害不在它排不排名,而在它打的是什么分、排的什么序。

它的机制是两组结构:

先识别用户已经看过的一组文档(同主题);
再识别还没看过的第二组;
信息增量分,是针对第二组每篇、相对于第一组算的——衡量这篇相比你已看过的内容,多出多少新信息。

三个关键限定:

它是关系量,不是页面固有属性。 同一篇页面,对”已读 A”的人有增量,对没读过的人没有。分数随读者的阅读历史变。
没有”已读集合”就没有这个分。 专利明说:当一组文档用户都还没看过时,不生成信息增量分(或给个无意义的相等分)。而初始搜索结果页,正是”还没看任何东西”的状态。
主要场景是助手,但不只助手。 专利说信息可经由自动助手、也可经由搜索引擎结果给出;助手对话(回答”帮我修电脑”)是最清楚的例子——目的是在后续轮次里不重复已说过的内容,只给新的那个。

换句话说,它是会话内、按你已读内容去重的呈现与重排机制,不是十条蓝链初排的门槛。

它怎么被掏空成口号

把这篇专利捞进 SEO 讨论的,是已故的 Bill Slawski——谷歌专利解读第一人。但他原文全程用 “may”:信息增量分高的页面”可能”排得更高;而且他明说,有专利不代表谷歌现在就在用,甚至可能只是 aspirational。

变味的关键一步是内容工具。比如 MarketMuse 的《Content Writing for Information Gain》,把 Slawski 的保留全删掉,直接做成”你必须达标的内容 KPI”。卖内容优化工具的,有充分动机把”一句带 maybe 的专利观察”,包装成”不加信息增量就排不上”。

到了中文圈,”信息增量 / 信息增值”再被翻译一层,继承同一个误读,又常跟 GEO、AEO 的热点捆在一起卖。

套路每一层都一样:拿一个有真实技术血统的精确量 → 剥掉定义和语境 → 膨胀成一句模糊、可售卖的内容口号。它能唬住人,恰恰因为前面那层硬核出身被当成了信用背书,而真正的定义早被丢了。

PS：个人实用经验、理解、体验等内容是在用户行为角度上给navboost加分，从而有机会去提高排名。