2026年5月22-23日,雅典 The Ellinikon Experience Centre。
十几位全球顶级 SEO 从业者——Aleyda Solís、Lily Ray、Mark Williams-Cook、Dan Taylor、Judith Lewis、Jonathan Moore、Simone De Palma、Frank van Dijk——从不同角度、不同专业背景出发,最后都走向了同一个结论。
这篇文章把他们两天的演讲和 Panel 讨论串在一起,提炼出五个核心主题。如果你只记住一句话,那就是 Judith Lewis 的那句:
“It’s SEO. It’s not GEO. It’s not AEO.”
一、行业共识已经形成:GEO/AEO 就是穿了红裙子的 SEO
Judith Lewis 用《黑客帝国》里红裙女人的比喻开场——GEO 和 AEO 看起来性感,回头一看,本质就是 SEO。她从 LLM 的工作原理切入:大语言模型通过 tokenization 把内容拆碎,放进多维向量空间,需要时重新组装来”推断”答案。它存储的不是事实,而是分布式表征。幻觉不是 bug,是架构的固有特性。
这意味着什么?LLM 必须依赖外部检索来获取可靠信息。而它检索的主要来源,就是传统搜索引擎的索引。
Judith 展示了证据:ChatGPT(尤其是 Plus 版本)使用 SerpApi 抓取 Google 搜索结果作为实时信息来源。当 Bing 索引中找不到某个 URL 时,ChatGPT 会回退到 Google 的索引。前 Google 工程师的测试也证实了这一点。
结论很简单:Rank well on Google, surface well in AI。
这个判断在 Panel 讨论中被集体确认。Lily Ray 用 Accuranker 对比了 ChatGPT 引用率和 Google 排名,发现两者”非常非常相似”。她更进一步,直接把 GEO 的 listicle 操纵手法定性为”gray hat scaled content”——等同于 Google 2024 年创建的 scaled content abuse 分类。一个真实案例:某品牌过去一年在 Google 和 ChatGPT 上大量使用 AI 内容,Panel 举办前两天刚被 Google 惩罚,整个博客从搜索结果中消失。
更值得注意的是 OpenAI 的态度。他们没有把 GEO 式的 SEO 操纵仅仅当作 spam,而是归类为 prompt injection attacks——安全威胁级别的定性。
Mark Williams-Cook 则用一个绝妙的实验彻底拆穿了行业里”低证据门槛”的问题。他创建了一个 cats.txt “标准”——一个描述公司猫咪信息的文件,包含名字、品种、PurrLevel 等字段。结果:Anthropic、OpenAI、Google、Perplexity 的爬虫全部爬取了它,每天数百次;朋友把它放到网站后,Google AI Overview 直接从中抽取猫咪信息返回;ChatGPT 被问”cats.txt 能帮排名吗”时回答”Yes”并给出一堆理由。
论证链条完美闭合:用 llms.txt 支持者完全相同的逻辑——”被爬了所以有用””被索引了所以影响排名””ChatGPT 说有效”——他”证明”了 cats.txt 的价值。如果 cats.txt 的证据不成立,llms.txt 的也不成立。
一个彩蛋:搜 catstxt 排名第一的 catstxt.org 不是 Mark 做的,经调查发现是 Google Earth 团队工程师做的——Google 内部也在玩这个梗。
这就是整个行业需要面对的现实:GEO/AEO 有了一个 sexy new name,从业者可以利用这个热度推动工作,但不能假装这是全新的服务然后加价收费。 正如 Judith 所说:”It’s a difficult, difficult tightrope to walk.”
一个很实用的职场策略:把以前一直催 CMO 要做但被忽视的 SEO ticket,重新标记为”AI 优化需要”提交。内容完全一样,换个标签突然就被优先处理了。
二、AI 搜索的底层逻辑:它在”读取”你,而不是”运行”你
Athens SEO 2026 最具技术深度的洞察之一,来自对 Google 内部两套系统的区分。
Googlebot 和 Gemini 不是同一套基础设施。
Google 传统搜索系统(Googlebot Crawling Infrastructure)会真正”跑你的前端应用”——批量抓取、Chromium 渲染、执行 JS、hydration、API 请求、完整 rendering pipeline。这是传统 SEO 面对的系统。
但 Gemini 和 AI 搜索用的是另一套:live fetch、用户触发、轻量基础设施、不走正常 crawling pipeline、不经过 rendering infrastructure。Martin Splitt 基本已经半公开确认:”Gemini fetch 当前不 render。”
这意味着 AI 系统可能只读取初始 HTML、SSR 内容、静态 DOM、server-rendered text。而 hydration 后的内容、CSR 内容、lazy load、infinite scroll、delayed API content、React client state——AI 可能完全看不到。
Simone De Palma 的 TUI 实际数据验证了这一点:JS 内容多的页面被 ChatGPT-User 检索得更少;JS 内容少、信息自包含的页面被检索得更多。结论:Less JavaScript = More LLM Retrieval。
Judith Lewis 把这个判断上升到了可执行层面:
- CDN 是否自动屏蔽了 AI 爬虫(Cloudflare 等可能默认 block AI bots)
- 避免纯客户端渲染——AI 看不到
- 检查是否有页面被误设 noindex
- 避免使用 nosnippet 规则——会阻止内容被 AI Overviews 和 AI Mode 引用
Serge Bezborodov(JetOctopus CTO)补充了一个关键警告:“I’m fine, we don’t block AI bots in robots.txt”这句话是危险的。 真正的阻断往往发生在 WAF/CDN 层面,不是 robots.txt。需要与 DevOps/SRE 沟通,在防火墙层面白名单 AI 爬虫的 IP。
还有一个更深层的技术问题:很多人认为”Google 能执行 JS,所以 SSR 没用了”。但真正的问题不是”能不能 render”,而是”render 成本有多高”。CSR 会导致更多 network requests、更多 API calls、更多 hydration、更多 JS execution。尤其大型网站的 GraphQL、React hydration、chained requests,会让 Googlebot 的处理成本暴涨。而 GraphQL 和 JSON RPC 默认使用 POST Requests(不可缓存),每个页面都重新请求 API,render 成本进一步放大。
现代 SEO 已经进入”渲染工程”时代。 最终结论:Google Search 可以”运行你的应用”,但 Gemini 更像”读取你的 HTML”。
对于使用 WordPress + Astra + Elementor 这类服务端渲染技术栈的网站来说,这反而是天然优势。
三、测量鸿沟:旧指标在坍塌,新指标是幻觉
Jonathan Moore 提出了一个自创概念:AI Measurement Chasm(AI 测量鸿沟)。
鸿沟左侧:从 LLM 平台拿不到第一方数据。只有极少量数据从 Bing 那边渗透过来。传统的数据测量体系像积木塔一样在坍塌。
鸿沟右侧:770+ 家公司涌入 prompt tracking / AI visibility 赛道,但 prompt tracking “far from perfect”——AI 回答高度不一致,每次 prompt 的回答都不一样,你怎么做稳定的 tracking?
Simone De Palma 的演讲把这个问题拆解到了技术底层。他引用 Dawn Anderson 的观点,做了一个关键概念澄清:Grounding queries 不是用户搜索,它们是 LLM 在 RAG 流程中自己生成的合成检索查询。 LLM 根据用户的 prompt 做”最佳猜测”,生成查询去检索信息,然后用检索结果验证和合成最终回答。Prompt tracking 实际上在测量一个空白点——追踪的是 LLM 对用户 prompt 的最佳猜测,不是 prompt 本身,也不是用户真实意图。
被忽略的变量太多:模型的 fine-tune 差异、随机采样、temperature、grounding 过程、偏见和启发式规则、用户位置、过往对话历史……你追踪到的只是模型的猜测,而这个猜测受十几个你无法控制的变量影响。
更糟糕的是,GEO 追踪工具本身就是数据污染源。Simone 在数据中发现:这些工具会预设国家/语言修饰词(如”in united kingdom, be sure to reply in english”)拼接到查询后面,然后把修改过的合成查询当成”真实搜索数据”呈现。如果这些工具使用不够可靠的 proxy,大量合成查询就会直接污染 GSC 和 Bing 的数据。
Bengü Sarica Dincer 从商业视角补充了另一层断裂:传统 SEO 的逻辑链(排名高 → 流量多 → 收入涨)已经断了。她用 Designmodo 的例子证明:Google 搜”email builder”排第 3,但在 ChatGPT 里问同样的问题,前三名一个都没出现。出现在 AI 结果里也不等于被记住——Beehive 出现在 Gemini 推荐里,但 Google Trends 反而在下降。网站的角色已经从”说服阶段”转变为”确认阶段”——用户到你网站之前决策已经完成了。
Jonathan Moore 用丹麦谚语开场:”You can’t fatten a pig by weighing it.”——称猪不会让猪变胖。行业一直在堆积数据,但从来没有把数据转化为客户真正需要的成果。他的解法是苏格拉底式思维:通过问对的问题来找到正确答案。
那应该问什么问题?他给出了 3R 框架:
Revenue — 我们在赚钱吗?不是 impressions、clicks、rankings,而是直接看 revenue。他用真实客户数据展示:Total revenue 稳步上升,Organic revenue 平稳,LLM revenue 几乎为零——用数据确定优先级。同时检查 revenue per session 有没有下降(流量涨了但单次收入降了 = 流量质量下降)。引入 RFM 分析矩阵看 SEO 在给你带来哪类客户。
Recognition — 我们被正确认知了吗?每个 prompt 跑 5-10 次(因为 AI 回答不一致),每次用新 chat 关闭 memory,两周追踪一次。三个核心问题:AI 认不认识我们?AI 认为我们以什么著称?在核心属性查询中 AI 会不会提到我们?
Recommendations — 我们被推荐了吗?从”主动推荐”到”列为选项”到”顺带提及”到”完全没出现”,分级追踪。每个 AI 模型各做一份对照矩阵。
最实用的归因方法反而是最简单的:在询盘表单里加一个”How did you find us?”字段,包含 AI 工具选项。 既然 AI 平台不给你第一方数据,就从用户那端获取。零成本 workaround。
四、该做什么:回归基本面,但要用新的框架
如果 GEO/AEO 就是 SEO,那具体该做什么?Athens SEO 2026 给出了从战略到执行的完整路径。
战略层:站内打底,站外证实
Aleyda Solís 提出了 AI Readiness 的 10 项评估标准:Accessible(AI 爬虫能否抓取)、Useful(内容是否比 AI 现有答案更有竞争力)、Recognizable(品牌/实体信号是否清晰)、Extractable(核心卖点是否易于被提取)、Consistent(全网实体信号是否统一)、Corroborated(是否有独立第三方验证)、Credible(背书来源是否权威)、Differentiated(定位是否不可替换)、Fresh(内容是否足够新)、Transactable(是否清晰到 AI 能回答”哪款适合我”)。
她的核心论断:”AI search visibility for ecommerce is an off-site corroboration problem with an on-site quality floor.”——站内是门槛,站外才是关键。AI 模型通过全网第三方数据来判定品牌可信度。AI 引用份额最高的是综合大卖场(Amazon 12.5%、Etsy 17.1%),因为全网到处都有它们的第三方提及。
内容层:创作 Gemini 无法生成的内容
Lily Ray 在 Panel 中给出了最精准的一句话:”你的内容策略应该是——如何创作 Gemini 无法生成的内容?”
模板化规模化内容,即使不是 AI 生成的,本质也是 commodity content,正在被系统性清除。差异化来自两个维度:Experience(经验) 和 Personality(个性)。Google 加第二个 E 的原因,和 Reddit 在搜索中崛起是同一个逻辑——真实经历过的人有 AI 永远没有的东西。
Wil Reynolds(Seer Interactive)的实践案例:建了一个自动化流程——文章发布前 AI 打电话给创始人,问他对话题的看法,然后融入内容。
Alpitour 案例(GA Agency 的 Alessia Mancini 和 Andrea Masoni)是整个大会最完整的实战样本。这家意大利最大的传统旅行社做了三件事:大规模修剪几十万个低质量 programmatic 页面(内容浓缩);用 BuzzWatch 做语义词簇重组(主题权威);让目的地经理真人署名、建立验证作者页面、深度集成 Schema.org(E-E-A-T 加码)。14 周后的成绩单:AI 整体引用量 +68.5%,交易型意图提示词中拿下 75% AI 可见度,35% 的引用直接指向产品落地页。
他们还做了一个颠覆性的 Digital PR 策略调整:不再盲目看 DR 高低,而是逆向分析 AI 在回答目标问题时到底引用了哪些域名,把公关预算 100% 砸在这些”AI 信任水源地”上。
技术层:向量化 SEO
Frank van Dijk 展示了一套基于余弦相似度(Cosine Similarity)的页面关系判定框架:
- 相似度 < 0.70 → 不相关,不管它
- 0.70 – 0.95 → 语义相关但不重复,做内链(甜点区)
- > 0.95 → 语义高度重合,查重/合并(Cannibalization)
他引用 DOJ 反垄断案披露的 Google 搜索内部架构,将搜索过程拆解为四层:Keyword matching(BM25 倒排索引)→ RankEmbed(语义向量匹配)→ DeepRank(深度神经网络)→ NavBoost(用户点击信号)。第一层是门槛,第二三层才是竞争力。
实操路线图从零代码到工程化:Screaming Frog v20+ 已内置 Embedding 功能(填入 API Key 即可)→ Python 脚本精细控制 → BigQuery 构建 Vector DB → 封装为团队工作流。
数据层:用现有工具构建 AI 可见性追踪
Simone De Palma 的方案最具工程深度。核心思路:把搜索行为数据(GSC 告诉你 what)和服务器信号(日志告诉你 how)合并。
GSC 数据通过 BigQuery Bulk Data Export 突破 16 个月窗口和采样限制;Bing 数据通过 API 拉取(92% 的 ChatGPT agents 使用 Bing API 获取实时结果);两边数据 UNION ALL 合并后,用 RegEx 做 Funnel Intent Mapping(Information / Consideration / Transactional 三层)。
服务器日志分析方面,ChatGPT-User 的 user-agent 有三个特性:按需访问(用户 prompt 触发,不是全站爬取)、直接意图信号、只读原始 HTML。但要注意 70-80% 的 LLM bot 流量是冒充者,必须做 IP 反查验证。
他的 TUI 实际数据非常有说服力:被 ChatGPT-User 真实检索最多的页面全部是实用信息型页面(优惠、预算工具、天气、行李规格),不是品牌首页或导航页。
决策层:用 EV 思维选择策略
Mark Williams-Cook 用扑克思维给出了决策框架:Expected Value = 潜在收益 × 成功概率 − 成本。
Cash Game = Black Hat SEO(输了换域名继续,最优策略是激进);Tournament = White Hat SEO(只有一条命,最优策略是保守)。Grey Hat 是最差 EV——短期中等收益,长期负 EV(品牌域名被打,恢复代价巨大)。
他展示了一个知名 SaaS 品牌的案例:用 AI 做 programmatic SEO,流量从 2021 年爆发到 220K/月,然后被 Google 清洗归零。恢复周期 1-2 年,而且 Google 在站点层面施加声誉惩罚,连正常的商业页面排名也受影响。
一个终极思维测试:“Would I be doing this if search engines didn’t exist?” 如果答案是 yes,说明你在创造真正的 business equity,不管算法怎么变价值都在。
五、对中国外贸 SEO 从业者的特别启示
Athens SEO 2026 的讨论有几个点,对做英文 SEO 的中国外贸从业者尤其重要。
英文内容在 AI 时代的权重更大了。 Dan Taylor 在 Panel 中分享了技术细节:虽然 Common Crawl 原始数据中英文内容约占 45%,但经过 C4(Colossal Clean Crawled Corpus)等过滤管道处理后,英文在主流 LLM 训练数据中的占比被大幅放大——C4 本身被设计为纯英文语料库,非英文内容在过滤阶段被系统性排除。Dan Taylor 指出,C4 用内容语言判断目标市场,而非内容实际服务的市场——这是 AI Overview 早期出现跨市场”乱排”的根本原因。AI 搜索不看 hreflang,语言相同就可能跨市场引用。非主流语言进入训练数据的门槛极高。
这意味着:如果你的目标客户用英文搜索、你的网站是英文内容、你在 Google 英文搜索中排名靠前,那你在 AI 搜索中被引用的概率天然就高于小语种竞争对手。对于中国外贸企业来说,做好英文 Google SEO 就是做好 AI 搜索优化的最直接路径。
WordPress 服务端渲染是天然优势。 当 Gemini 不 render、ChatGPT-User 只读原始 HTML 时,使用 WordPress + 传统主题(Astra、GeneratePress 等)输出的服务端渲染页面,比 React SPA、Next.js 重度 hydration、GraphQL 驱动的现代前端架构更容易被 AI 系统读取。这不是技术落后,是技术适配。
品牌实体建设是长期护城河。 Panel 中 Lily Ray 的最终建议是:品牌信息在整个生态系统中的一致性比追踪 prompt 更重要。Aleyda 的 Consistent 和 Corroborated 两项标准也指向同一个方向。50-60 个目录平台的注册、全平台统一信息、Schema 中的 Organization/Person 标记、知识图谱信号——这些”不性感”的基础工作,在 AI 时代变成了最难被竞争对手复制的资产。
美国 80-85% 的人还没用过 AI。 Panel 中提到的这个数据值得记住。AI 搜索采用率远低于行业从业者的感知。这意味着传统 Google SEO 在相当长一段时间内仍然是流量主力。不要因为行业焦虑而放弃基本面。
结语
Athens SEO 2026 两天的演讲,可以浓缩为 Mark Williams-Cook 的最后一句话:
“Do things for the business, not for SEO/GEO. Would I be doing this if search engines didn’t exist?”
GEO 不是新学科,Technical SEO 是基础,内容为人服务,retrievable 胜过 rankable,品牌实体胜过 prompt tracking。
没有什么单独的 GEO/AEO 方法论。做好 Google SEO,就是做好”AI 优化”。
独立Google SEO专家,ylsseo.com创始人,基于Google专利、IR与API Leak解读排名机制,中文SEO启蒙第一人。