Athens SEO 2026：全球顶级 SEO 大会

2026年5月22-23日，雅典 The Ellinikon Experience Centre。

十几位全球顶级 SEO 从业者——Aleyda Solís、Lily Ray、Mark Williams-Cook、Dan Taylor、Judith Lewis、Jonathan Moore、Simone De Palma、Frank van Dijk——从不同角度、不同专业背景出发，最后都走向了同一个结论。

这篇文章把他们两天的演讲和 Panel 讨论串在一起，提炼出五个核心主题。如果你只记住一句话，那就是 Judith Lewis 的那句：

“It’s SEO. It’s not GEO. It’s not AEO.”

一、行业共识已经形成：GEO/AEO 就是穿了红裙子的 SEO

Judith Lewis 用《黑客帝国》里红裙女人的比喻开场——GEO 和 AEO 看起来性感，回头一看，本质就是 SEO。她从 LLM 的工作原理切入：大语言模型通过 tokenization 把内容拆碎，放进多维向量空间，需要时重新组装来”推断”答案。它存储的不是事实，而是分布式表征。幻觉不是 bug，是架构的固有特性。

这意味着什么？LLM 必须依赖外部检索来获取可靠信息。而它检索的主要来源，就是传统搜索引擎的索引。

Judith 展示了证据：ChatGPT（尤其是 Plus 版本）使用 SerpApi 抓取 Google 搜索结果作为实时信息来源。当 Bing 索引中找不到某个 URL 时，ChatGPT 会回退到 Google 的索引。前 Google 工程师的测试也证实了这一点。

结论很简单：Rank well on Google, surface well in AI。

这个判断在 Panel 讨论中被集体确认。Lily Ray 用 Accuranker 对比了 ChatGPT 引用率和 Google 排名，发现两者”非常非常相似”。她更进一步，直接把 GEO 的 listicle 操纵手法定性为”gray hat scaled content”——等同于 Google 2024 年创建的 scaled content abuse 分类。一个真实案例：某品牌过去一年在 Google 和 ChatGPT 上大量使用 AI 内容，Panel 举办前两天刚被 Google 惩罚，整个博客从搜索结果中消失。

更值得注意的是 OpenAI 的态度。他们没有把 GEO 式的 SEO 操纵仅仅当作 spam，而是归类为 prompt injection attacks——安全威胁级别的定性。

Mark Williams-Cook 则用一个绝妙的实验彻底拆穿了行业里”低证据门槛”的问题。他创建了一个 cats.txt “标准”——一个描述公司猫咪信息的文件，包含名字、品种、PurrLevel 等字段。结果：Anthropic、OpenAI、Google、Perplexity 的爬虫全部爬取了它，每天数百次；朋友把它放到网站后，Google AI Overview 直接从中抽取猫咪信息返回；ChatGPT 被问”cats.txt 能帮排名吗”时回答”Yes”并给出一堆理由。

论证链条完美闭合：用 llms.txt 支持者完全相同的逻辑——”被爬了所以有用””被索引了所以影响排名””ChatGPT 说有效”——他”证明”了 cats.txt 的价值。如果 cats.txt 的证据不成立，llms.txt 的也不成立。

一个彩蛋：搜 catstxt 排名第一的 catstxt.org 不是 Mark 做的，经调查发现是 Google Earth 团队工程师做的——Google 内部也在玩这个梗。

这就是整个行业需要面对的现实：GEO/AEO 有了一个 sexy new name，从业者可以利用这个热度推动工作，但不能假装这是全新的服务然后加价收费。 正如 Judith 所说：”It’s a difficult, difficult tightrope to walk.”

一个很实用的职场策略：把以前一直催 CMO 要做但被忽视的 SEO ticket，重新标记为”AI 优化需要”提交。内容完全一样，换个标签突然就被优先处理了。

二、AI 搜索的底层逻辑：它在”读取”你，而不是”运行”你

Athens SEO 2026 最具技术深度的洞察之一，来自对 Google 内部两套系统的区分。

Googlebot 和 Gemini 不是同一套基础设施。

Google 传统搜索系统（Googlebot Crawling Infrastructure）会真正”跑你的前端应用”——批量抓取、Chromium 渲染、执行 JS、hydration、API 请求、完整 rendering pipeline。这是传统 SEO 面对的系统。

但 Gemini 和 AI 搜索用的是另一套：live fetch、用户触发、轻量基础设施、不走正常 crawling pipeline、不经过 rendering infrastructure。Martin Splitt 基本已经半公开确认：”Gemini fetch 当前不 render。”

这意味着 AI 系统可能只读取初始 HTML、SSR 内容、静态 DOM、server-rendered text。而 hydration 后的内容、CSR 内容、lazy load、infinite scroll、delayed API content、React client state——AI 可能完全看不到。

Simone De Palma 的 TUI 实际数据验证了这一点：JS 内容多的页面被 ChatGPT-User 检索得更少；JS 内容少、信息自包含的页面被检索得更多。结论：Less JavaScript = More LLM Retrieval。

Judith Lewis 把这个判断上升到了可执行层面：

CDN 是否自动屏蔽了 AI 爬虫（Cloudflare 等可能默认 block AI bots）
避免纯客户端渲染——AI 看不到
检查是否有页面被误设 noindex
避免使用 nosnippet 规则——会阻止内容被 AI Overviews 和 AI Mode 引用

Serge Bezborodov（JetOctopus CTO）补充了一个关键警告：“I’m fine, we don’t block AI bots in robots.txt”这句话是危险的。 真正的阻断往往发生在 WAF/CDN 层面，不是 robots.txt。需要与 DevOps/SRE 沟通，在防火墙层面白名单 AI 爬虫的 IP。

还有一个更深层的技术问题：很多人认为”Google 能执行 JS，所以 SSR 没用了”。但真正的问题不是”能不能 render”，而是”render 成本有多高”。CSR 会导致更多 network requests、更多 API calls、更多 hydration、更多 JS execution。尤其大型网站的 GraphQL、React hydration、chained requests，会让 Googlebot 的处理成本暴涨。而 GraphQL 和 JSON RPC 默认使用 POST Requests（不可缓存），每个页面都重新请求 API，render 成本进一步放大。

现代 SEO 已经进入”渲染工程”时代。 最终结论：Google Search 可以”运行你的应用”，但 Gemini 更像”读取你的 HTML”。

对于使用 WordPress + Astra + Elementor 这类服务端渲染技术栈的网站来说，这反而是天然优势。

三、测量鸿沟：旧指标在坍塌，新指标是幻觉

Jonathan Moore 提出了一个自创概念：AI Measurement Chasm（AI 测量鸿沟）。

鸿沟左侧：从 LLM 平台拿不到第一方数据。只有极少量数据从 Bing 那边渗透过来。传统的数据测量体系像积木塔一样在坍塌。

鸿沟右侧：770+ 家公司涌入 prompt tracking / AI visibility 赛道，但 prompt tracking “far from perfect”——AI 回答高度不一致，每次 prompt 的回答都不一样，你怎么做稳定的 tracking？

Simone De Palma 的演讲把这个问题拆解到了技术底层。他引用 Dawn Anderson 的观点，做了一个关键概念澄清：Grounding queries 不是用户搜索，它们是 LLM 在 RAG 流程中自己生成的合成检索查询。 LLM 根据用户的 prompt 做”最佳猜测”，生成查询去检索信息，然后用检索结果验证和合成最终回答。Prompt tracking 实际上在测量一个空白点——追踪的是 LLM 对用户 prompt 的最佳猜测，不是 prompt 本身，也不是用户真实意图。

被忽略的变量太多：模型的 fine-tune 差异、随机采样、temperature、grounding 过程、偏见和启发式规则、用户位置、过往对话历史……你追踪到的只是模型的猜测，而这个猜测受十几个你无法控制的变量影响。

更糟糕的是，GEO 追踪工具本身就是数据污染源。Simone 在数据中发现：这些工具会预设国家/语言修饰词（如”in united kingdom, be sure to reply in english”）拼接到查询后面，然后把修改过的合成查询当成”真实搜索数据”呈现。如果这些工具使用不够可靠的 proxy，大量合成查询就会直接污染 GSC 和 Bing 的数据。

Bengü Sarica Dincer 从商业视角补充了另一层断裂：传统 SEO 的逻辑链（排名高 → 流量多 → 收入涨）已经断了。她用 Designmodo 的例子证明：Google 搜”email builder”排第 3，但在 ChatGPT 里问同样的问题，前三名一个都没出现。出现在 AI 结果里也不等于被记住——Beehive 出现在 Gemini 推荐里，但 Google Trends 反而在下降。网站的角色已经从”说服阶段”转变为”确认阶段”——用户到你网站之前决策已经完成了。

Jonathan Moore 用丹麦谚语开场：”You can’t fatten a pig by weighing it.”——称猪不会让猪变胖。行业一直在堆积数据，但从来没有把数据转化为客户真正需要的成果。他的解法是苏格拉底式思维：通过问对的问题来找到正确答案。

那应该问什么问题？他给出了 3R 框架：

Revenue — 我们在赚钱吗？不是 impressions、clicks、rankings，而是直接看 revenue。他用真实客户数据展示：Total revenue 稳步上升，Organic revenue 平稳，LLM revenue 几乎为零——用数据确定优先级。同时检查 revenue per session 有没有下降（流量涨了但单次收入降了 = 流量质量下降）。引入 RFM 分析矩阵看 SEO 在给你带来哪类客户。

Recognition — 我们被正确认知了吗？每个 prompt 跑 5-10 次（因为 AI 回答不一致），每次用新 chat 关闭 memory，两周追踪一次。三个核心问题：AI 认不认识我们？AI 认为我们以什么著称？在核心属性查询中 AI 会不会提到我们？

Recommendations — 我们被推荐了吗？从”主动推荐”到”列为选项”到”顺带提及”到”完全没出现”，分级追踪。每个 AI 模型各做一份对照矩阵。

最实用的归因方法反而是最简单的：在询盘表单里加一个”How did you find us?”字段，包含 AI 工具选项。 既然 AI 平台不给你第一方数据，就从用户那端获取。零成本 workaround。

四、该做什么：回归基本面，但要用新的框架

如果 GEO/AEO 就是 SEO，那具体该做什么？Athens SEO 2026 给出了从战略到执行的完整路径。

战略层：站内打底，站外证实

Aleyda Solís 提出了 AI Readiness 的 10 项评估标准：Accessible（AI 爬虫能否抓取）、Useful（内容是否比 AI 现有答案更有竞争力）、Recognizable（品牌/实体信号是否清晰）、Extractable（核心卖点是否易于被提取）、Consistent（全网实体信号是否统一）、Corroborated（是否有独立第三方验证）、Credible（背书来源是否权威）、Differentiated（定位是否不可替换）、Fresh（内容是否足够新）、Transactable（是否清晰到 AI 能回答”哪款适合我”）。

她的核心论断：”AI search visibility for ecommerce is an off-site corroboration problem with an on-site quality floor.”——站内是门槛，站外才是关键。AI 模型通过全网第三方数据来判定品牌可信度。AI 引用份额最高的是综合大卖场（Amazon 12.5%、Etsy 17.1%），因为全网到处都有它们的第三方提及。

内容层：创作 Gemini 无法生成的内容

Lily Ray 在 Panel 中给出了最精准的一句话：”你的内容策略应该是——如何创作 Gemini 无法生成的内容？”

模板化规模化内容，即使不是 AI 生成的，本质也是 commodity content，正在被系统性清除。差异化来自两个维度：Experience（经验） 和 Personality（个性）。Google 加第二个 E 的原因，和 Reddit 在搜索中崛起是同一个逻辑——真实经历过的人有 AI 永远没有的东西。

Wil Reynolds（Seer Interactive）的实践案例：建了一个自动化流程——文章发布前 AI 打电话给创始人，问他对话题的看法，然后融入内容。

Alpitour 案例（GA Agency 的 Alessia Mancini 和 Andrea Masoni）是整个大会最完整的实战样本。这家意大利最大的传统旅行社做了三件事：大规模修剪几十万个低质量 programmatic 页面（内容浓缩）；用 BuzzWatch 做语义词簇重组（主题权威）；让目的地经理真人署名、建立验证作者页面、深度集成 Schema.org（E-E-A-T 加码）。14 周后的成绩单：AI 整体引用量 +68.5%，交易型意图提示词中拿下 75% AI 可见度，35% 的引用直接指向产品落地页。

他们还做了一个颠覆性的 Digital PR 策略调整：不再盲目看 DR 高低，而是逆向分析 AI 在回答目标问题时到底引用了哪些域名，把公关预算 100% 砸在这些”AI 信任水源地”上。

技术层：向量化 SEO

Frank van Dijk 展示了一套基于余弦相似度（Cosine Similarity）的页面关系判定框架：

相似度 < 0.70 → 不相关，不管它
0.70 – 0.95 → 语义相关但不重复，做内链（甜点区）
> 0.95 → 语义高度重合，查重/合并（Cannibalization）

他引用 DOJ 反垄断案披露的 Google 搜索内部架构，将搜索过程拆解为四层：Keyword matching（BM25 倒排索引）→ RankEmbed（语义向量匹配）→ DeepRank（深度神经网络）→ NavBoost（用户点击信号）。第一层是门槛，第二三层才是竞争力。

实操路线图从零代码到工程化：Screaming Frog v20+ 已内置 Embedding 功能（填入 API Key 即可）→ Python 脚本精细控制 → BigQuery 构建 Vector DB → 封装为团队工作流。

数据层：用现有工具构建 AI 可见性追踪

Simone De Palma 的方案最具工程深度。核心思路：把搜索行为数据（GSC 告诉你 what）和服务器信号（日志告诉你 how）合并。

GSC 数据通过 BigQuery Bulk Data Export 突破 16 个月窗口和采样限制；Bing 数据通过 API 拉取（92% 的 ChatGPT agents 使用 Bing API 获取实时结果）；两边数据 UNION ALL 合并后，用 RegEx 做 Funnel Intent Mapping（Information / Consideration / Transactional 三层）。

服务器日志分析方面，ChatGPT-User 的 user-agent 有三个特性：按需访问（用户 prompt 触发，不是全站爬取）、直接意图信号、只读原始 HTML。但要注意 70-80% 的 LLM bot 流量是冒充者，必须做 IP 反查验证。

他的 TUI 实际数据非常有说服力：被 ChatGPT-User 真实检索最多的页面全部是实用信息型页面（优惠、预算工具、天气、行李规格），不是品牌首页或导航页。

决策层：用 EV 思维选择策略

Mark Williams-Cook 用扑克思维给出了决策框架：Expected Value = 潜在收益 × 成功概率 − 成本。

Cash Game = Black Hat SEO（输了换域名继续，最优策略是激进）；Tournament = White Hat SEO（只有一条命，最优策略是保守）。Grey Hat 是最差 EV——短期中等收益，长期负 EV（品牌域名被打，恢复代价巨大）。

他展示了一个知名 SaaS 品牌的案例：用 AI 做 programmatic SEO，流量从 2021 年爆发到 220K/月，然后被 Google 清洗归零。恢复周期 1-2 年，而且 Google 在站点层面施加声誉惩罚，连正常的商业页面排名也受影响。

一个终极思维测试：“Would I be doing this if search engines didn’t exist?” 如果答案是 yes，说明你在创造真正的 business equity，不管算法怎么变价值都在。

五、对中国外贸 SEO 从业者的特别启示

Athens SEO 2026 的讨论有几个点，对做英文 SEO 的中国外贸从业者尤其重要。

英文内容在 AI 时代的权重更大了。 Dan Taylor 在 Panel 中分享了技术细节：虽然 Common Crawl 原始数据中英文内容约占 45%，但经过 C4（Colossal Clean Crawled Corpus）等过滤管道处理后，英文在主流 LLM 训练数据中的占比被大幅放大——C4 本身被设计为纯英文语料库，非英文内容在过滤阶段被系统性排除。Dan Taylor 指出，C4 用内容语言判断目标市场，而非内容实际服务的市场——这是 AI Overview 早期出现跨市场”乱排”的根本原因。AI 搜索不看 hreflang，语言相同就可能跨市场引用。非主流语言进入训练数据的门槛极高。

这意味着：如果你的目标客户用英文搜索、你的网站是英文内容、你在 Google 英文搜索中排名靠前，那你在 AI 搜索中被引用的概率天然就高于小语种竞争对手。对于中国外贸企业来说，做好英文 Google SEO 就是做好 AI 搜索优化的最直接路径。

WordPress 服务端渲染是天然优势。 当 Gemini 不 render、ChatGPT-User 只读原始 HTML 时，使用 WordPress + 传统主题（Astra、GeneratePress 等）输出的服务端渲染页面，比 React SPA、Next.js 重度 hydration、GraphQL 驱动的现代前端架构更容易被 AI 系统读取。这不是技术落后，是技术适配。

品牌实体建设是长期护城河。 Panel 中 Lily Ray 的最终建议是：品牌信息在整个生态系统中的一致性比追踪 prompt 更重要。Aleyda 的 Consistent 和 Corroborated 两项标准也指向同一个方向。50-60 个目录平台的注册、全平台统一信息、Schema 中的 Organization/Person 标记、知识图谱信号——这些”不性感”的基础工作，在 AI 时代变成了最难被竞争对手复制的资产。

美国 80-85% 的人还没用过 AI。 Panel 中提到的这个数据值得记住。AI 搜索采用率远低于行业从业者的感知。这意味着传统 Google SEO 在相当长一段时间内仍然是流量主力。不要因为行业焦虑而放弃基本面。

结语

Athens SEO 2026 两天的演讲，可以浓缩为 Mark Williams-Cook 的最后一句话：

“Do things for the business, not for SEO/GEO. Would I be doing this if search engines didn’t exist?”

GEO 不是新学科，Technical SEO 是基础，内容为人服务，retrievable 胜过 rankable，品牌实体胜过 prompt tracking。

没有什么单独的 GEO/AEO 方法论。做好 Google SEO，就是做好”AI 优化”。

鸭老师SEO

独立Google SEO专家，ylsseo.com创始人，基于Google专利、IR与API Leak解读排名机制，中文SEO启蒙第一人。