共享数据会暴露谷歌的知识产权,招致垃圾邮件滥用,并危及用户隐私。
谷歌搜索部门负责人向联邦法院警告称,强迫该公司与竞争对手共享其搜索索引、排名数据和实时结果,将对谷歌、其用户和开放网络造成“直接且不可弥补的损害”。
该警告出现在谷歌副总裁兼搜索主管伊丽莎白·里德提交的一份宣誓书中,该宣誓书与谷歌提出的暂停关键反垄断补救措施的动议一起提交,当时谷歌正在就司法部搜索垄断案的*终判决提出上诉。
该文件详细阐述了谷歌认为*敏感的搜索资产是什么,以及为什么分享这些资产会暴露专有系统、导致逆向工程和助长垃圾邮件。

披露谷歌网络搜索索引
这场斗争:*终判决的第四部分将迫使谷歌以极低的成本向“合格的竞争对手”*性提供其核心网络索引数据。这些数据将包括:
- Google 网络搜索索引中的每个 URL
- DocID 到 URL 的映射
- 爬取时间数据
- 垃圾邮件评分
- 设备类型标志
谷歌的论点:这将把超过 25 年的索引工作成果和积累的洞察力拱手让给竞争对手。
Reid 将该索引描述为专有爬虫、注释和分层系统的产物,这些系统决定哪些页面会进入 Google 搜索:
- “谷歌搜索索引中网页的选择,是二十五年来持续投资和不懈工程努力的结果。”
她警告说,仅仅知道谷歌索引了哪些网址,就能让竞争对手完全跳过大部分的抓取和分析工作:
- “获得谷歌索引中的网址列表后,合格的竞争对手就可以放弃抓取和分析整个网络,而是将精力集中在抓取谷歌索引中包含的那部分网页上。”
她补充说,抓取频率等元数据可以揭示谷歌如何优先考虑新鲜度和需求:
- “有关谷歌抓取计划的信息将使竞争对手深入了解谷歌专有的新鲜度信号和索引分级结构。”
宣誓书中附有这张图片“谷歌的网络爬虫和索引过程:结果”,显示谷歌将绝大多数网页标记为“垃圾邮件、重复内容和低质量页面”。
- 据谷歌高管潘杜·纳亚克 (Pandu Nayak) 作证,截至 2020 年,谷歌的索引包含约4000 亿份文档。
存在垃圾邮件、滥用和声誉损害的风险
令人担忧的是:谷歌认为,即使是间接地公开垃圾邮件评分,也会削弱其打击网络垃圾邮件的能力。
里德强调,有效打击垃圾邮件的关键在于保密:
- “打击垃圾邮件的关键在于保持隐蔽性,因为一旦外界了解了反垃圾邮件机制或信号,这些机制和信号就失去了价值。”
里德警告说,如果垃圾邮件评分泄露或遭到入侵,不法分子可能会利用这些信息绕过谷歌的防御措施:
- “垃圾邮件发送者……可以绕过谷歌的垃圾邮件检测技术,从而削弱谷歌打击垃圾邮件的努力。”
这将导致更多低质量和误导性内容出现在搜索结果中,*终用户会责怪谷歌:
- “强制披露可能会导致更多垃圾邮件和误导性内容出现在用户查询中,从而危及用户安全并损害谷歌作为值得信赖的搜索引擎的声誉。”
用户端搜索数据(Glue 和 RankEmbed)的披露
判决要求:持续共享用于运行谷歌 Glue 和 RankEmbed 模型的“用户端数据”。里德表示,这些数据包括:
- 查询
- 地点
- 搜索时间
- 点击、悬停和其他交互
- 显示的所有结果和搜索功能及其顺序
根据宣誓书,Glue 捕获了 13 个月的美国搜索日志。
谷歌的论点:这将相当于大规模、持续地公开谷歌的排名结果。
- “披露 Glue 训练数据相当于披露谷歌的知识产权,因为它泄露了谷歌搜索技术对美国用户在 13 个月内发出的每一个查询的响应结果。”
她还警告说,这些数据可以直接被重复使用。
- “合格的竞争者还可以很容易地使用已公开的 Glue 和 RankEmbed 数据作为大型语言模型的训练数据。”
关于隐私问题,里德强调,谷歌不会控制*终的匿名化决定。
- “谷歌对用户数据共享前要应用的匿名化和隐私增强技术没有*终决定权。”
里德预测,用户仍然会追究谷歌对任何后果的责任。
- “尽管如此,谷歌用户仍可能将数据泄露引发的任何隐私或安全问题归咎于谷歌。”
谷歌搜索结果和功能的联合发布
要求:第五部分将强制谷歌向竞争对手授权并联合发布核心搜索结果,期限*长可达五年,其中包括:
- 自然搜索结果(“十个蓝色链接”)
- 查询重写
- 本地信息、地图、图片、视频和知识面板
谷歌警告:这将使其搜索系统的实时输出结果暴露给竞争对手,甚至更广泛的受众。
- “向合格竞争对手提供所需的搜索结果和功能,是数十年来持续的工程努力和创新以及数十亿美元投资的成果。”
里德表示,即使有合同限制,谷歌也会失去控制权:
- “谷歌现在没有能力(像往常一样)拒绝向合格的竞争对手提供推广服务。”
里德警告说,竞争对手可能会存储、分析或泄露这些数据,第三方也可能抓取这些数据。
- “任何第三方都可以从合格竞争对手的网站上‘抓取’联合搜索结果和功能,从而也利用谷歌的搜索结果和功能。”
文件内容。
- 文件内容:伊丽莎白·里德的宣誓书(文件编号 1471,附件编号 2)
- 提交时间: 1月16日下午3:46(美国东部时间)
- 案件:美国诉谷歌有限责任公司,案号:1:20-cv-03010 (DDC)
- 目的:支持谷歌提出的在等待上诉期间部分中止反垄断措施的动议。
里德此前在补救措施听证会上作证说,该宣誓书反映了她作为谷歌搜索业务负责人的个人了解。
