了解 Google 的三大排名支柱、最终用户数据的重要作用、人们如何与搜索交互等。
美国司法部发布了几份新的审判文件,包括谷歌内部演示文稿、与搜索排名相关的文件和电子邮件。
以下是关于 Google 搜索排名因素、最终用户数据的重要作用、人们如何与搜索交互等的七个具体讨论。
1. 单击的生命周期(用户交互)
这是一份经过大量编辑的 PowerPoint 演示文稿,由 Google 的埃里克·雷曼 (Eric Lehman) 编写,与大多数材料一样,它缺乏完整的上下文。
员来说都非常有趣。
在“排名的三大 顶级电子邮件列表 支柱”幻灯片中,谷歌强调了三个领域:
- 内容:文档本身的内容。
- 锚点:其他网站对该文档的评价。
- 用户交互:用户对文档的评价。
谷歌添加了有关用户交互的注释:
“在某些地方,我们可能会使用‘点击’作为‘用户参与度’的代表。用户交互包括点击、关注结果、在轮播上滑动以及输入新查询。
在这张名为“用户参与信号”的幻灯片中,Google 说明了查询、交互和搜索结果的关系,以及查询的结果 [为什么海洋又变咸了]。 Google提到的具体交互:
- 读
- 点击次数
- 卷
- 移动鼠标
9月,雷曼兄弟在一项反垄断审判中作证称
然而,需要澄清的是,单独的点击次数对于排名来说是一个嘈杂的信号(有关更多信息,请参谷歌公开表示,它使用点击数据进行培训、评估、受控测试和个性化。
编辑内容:
- 这张幻灯片的标题是“指标”——只显示一行:“网络排名组件”。
- 另外七张幻灯片,其中两张标题为“大纲”和“摘要”。
链接(用户参与度)(2017 年 5 月 15 日)(PDF)
2. 评级
这七张幻灯片是雷曼兄弟准备的 2016 年第四季度联合搜索大型演示文稿的一部分。
在这张幻灯片中,谷歌表示“我们不理解文档。我们假装它。
- “今天,我们直接理解材料的能力非常有限。
- 因此,我们观察人们对材料的反应,并牢记他们的反应。”
而谷歌的“神奇”起源也被揭晓:
“让我们从一些基础知识开始……
每天有十亿次,人们要求我们查找与查询相关的文档。
疯狂的是我们并不真正理解这些材料。除了一些基本的东西之外,我们几乎没有看材料。
我们看人。
如果一份文件收到积极的反馈,我们就认为它是好的。如果反应是负面的,那么它可能很糟糕。
简化整个事情,这就是谷歌的魔力所在。 ”
那么它是如何运作的呢?
在这张幻灯片中,谷歌解释了“每个搜索者如何从过去的用户反馈中受益……并提供有利于未来用户的反馈”:
“搜索继续按照归纳原则进行操作。
这具有重要意义。
在设计用户体验时,仅仅为用户服务是不够的。
我们必须设计能够向用户学习的交互。
因为这就是我们为下一个人服务的方式,继续归纳过程并维持我们理解的幻觉。
展望未来,我相信向用户学习也是真正理解该语言的关键。 ”
在最后一张幻灯片中,谷歌总结了这样的声明:
- “当错误的理解失败时,我们就会显得愚蠢。”
其余四张幻灯片完全可以跳过,除非您想了解“搜索是开始理解语言的好地方。成功不仅仅在于搜索。”
文档链接
因此,当您看到 Google 声称链接不是前 3 个最重要的排名因素时,您现在希望可以更好地理解原因。这并不意味着链接不重要,也不意味着用户数据就是全部原因——机器学习和自然语言处理是其他重要部分。
谷歌正在关注最终用户,以及人们如何与搜索结果交互。不是作为个人,而是作为一个团体。
3. 研究排名
目前还不清楚是谁创建了这个演示文稿,但这里有一些非常有趣的发现。
在这张幻灯片中,Google 讨论了搜索质量的 18 个方面:
- 相关程度
- 页面质量
- 人气
- 新鲜
- 本土化
- 语言
- 中心性
- 主题多元化
- 个性化
- 网络生态系统
- 适合移动设备
- 社会正义
- 选项
- 色情降级
- 垃圾邮件
- 权限
- 隐私
- 用户控制纠正拼写错误
这张幻灯片讨论了测量直接流量的缺点。是的,谷歌基本上是在说点击不是一个好的信号,因为它们很难解释。
- “观察到的用户行为和搜索结果质量之间的联系很脆弱。我们需要大量流量才能得出结论,个别例子很难解释。”
最后,这张幻灯片提供了 Google 搜索结果排名如何运作的另一个说明:
本次演示中还有一些其他有趣的信息,尽管不一定与排名相关。注意问题:
- “操纵搜索结果的尝试是持续不断、复杂且资金充足的。有关搜索如何运作的信息仍有待了解。” (幻灯片 5)
- “让我们继续讨论搜索是如何在需要知道的基础上工作的。我们泄露的一切都将被 SEO、专利流氓、竞争对手等用来对付我们”(幻灯片 10)
- “除非与知情人士有必要了解,否则不要讨论搜索中点击的使用,并且不要向外部提出该主题。谷歌有一个公开立场。这是有争议的。但请不要自己制作。” (幻灯片 11)
链接
4. 谷歌很神奇
在本演示中,我们将了解搜索的实际工作原理。
这张幻灯片解释了搜索为何不起作用。从注释来看:
“我们收到了一个问题。不同的评分系统会发出数据,我们处理用户体验并将该数据发送给用户。
这并没有错,只是不完整。如此不完整,以这种方式构建的搜索引擎将无法正常运行。没有魔法。”
在这张幻灯片中,我们了解搜索的工作原理:
“重要的是,第二个信息流是相反的方向。
当人们与搜索互动时,他们的行为教会了我们关于世界的知识。
例如,点击可能会告诉我们图像比网络结果更好。或者长时间看可能意味着 KP 很有趣。
我们记录这些动作,然后评分团队提取狭义和一般的模式。”
接下来,我们来了解一下Google的“神奇”起源。从注释来看:
“谷歌的魔力源于它与用户的双向对话。
对于每个查询,我们提供一些知识并收到一些回报。然后我们多给予一点,也多接受一点。
这些位加起来。经过几千亿轮之后,我们开始看起来相当聪明了!
这不是我们学习的唯一方式,但却是最有效的方式。”
那么谷歌如何从用户那里了解更多信息呢?从注释来看:
“从表面上看,用户提出问题,谷歌给出答案。这是我们的基本业务。我们不能把事情搞砸。但我们必须悄悄地扭转局面。一种方法是:
-
隐式询问用户问题
-
提供必要的背景信息
-
给用户一些方式告诉我们答案”
这张幻灯片展示了 10 个蓝色链接。
“例如,十个蓝色链接隐含地 与冷流量交互时如何实现高转化率? 提出了这样的问题:‘哪个结果最好?’
预览结果提供基本信息。只需点击一下即可得到答案。
这是一个很好的学习用户体验。多年来,谷歌一直因其在平淡的用户界面中提供出色的搜索结果而受到嘲笑。
但这种平淡的用户界面使搜索结果看起来很棒。”
这张幻灯片位于图像搜索上:
“图像搜索提出了一个类似的问题——你最喜欢哪一个?缩略图提供基本信息,用户响应通过悬停、点击或进一步交互来捕获。”
最后是知识卡:
“例如,某些知识卡需要额外点击才能完全打开。
在左侧,按更多意味着用户想要排序较低并获得更好的概览。
右边,用户的基本信息太少。
添加什么?单击此处与向下滚动有何不同?用户无法做出正确的决定,因此点击和点击是日志中的特殊事件;我们应该赋予每个人以意义。”
链接:
5. 登录并评分
本演示讨论了“日志记录在排名和搜索中的重要作用”。
这张看起来很熟悉的幻灯片重现了双向对话,这是谷歌魔力的源泉。正如注释中所解释的:
“搜索有点像聚餐,每个人都带着一盘食物来分享。这是一道美味且用途广泛的菜肴,每个人都可以享用。但这只是因为每个人都做出了一点贡献才有效。
同样,搜索也需要大量知识的支持。但这不是我们创造的东西。相反,每个前来寻找的人都为这个系统
在这张幻灯片中,谷歌讨论了翻译用户行为。来自幻灯片注释:
“日志不包含明确的价值判断——这是一个好的搜索结果,这是一个坏的搜索结果。
因此,我们必须找到方法来解释用户行为,从而形成价值判断。
翻译实际上是非常复杂的,这是过去15年来人们一直在努力解决的一个问题。
人们致力于此,因为价值判断是谷歌搜索的基础。
如果我们能从一次会议中获得更多的意义,那么第二天我们就会得到十亿倍的意义。
基本的游戏是,你从少量的“基本事实”数据开始,这些数据在搜索页面上表明这个是好的,这个是坏的,这个比那个更好。
然后你看看所有相关的用户行为,然后说:“啊,这就是用户对好东西所做的事情!这就是用户做的坏事!这就是用户表达偏好的方式!”
当然,人都是不同的,也是善变的。所以我们得到的只是统计相关性,没有什么真正可靠的。
例如:
[做作的]
– 如果有人点击 3 个搜索结果,哪一个是不好的?嗯,可能是全部,因为如果他们点击 3 个结果,这可能是一个困难的查询。挑战在于找出哪些最有前途。”
最后,本幻灯片讨论日志记录如何支持排名和搜索。从注释来看:
“……这就是我警告你的部分。我在卖东西。我正在推销日记术语的想法,同时牢记评级团队的需求。很高兴在上面加糖。
但最根本的原因是,排名组在另一个方面确实很奇怪,那就是商业影响力。
正如我所提到的,排名中的不是一个系统而是许多系统都是建立在日志之上的。
这不仅是我之前向大家展示的传统系统,也是最先进的机器学习系统,其中许多系统我们已经公开了——RankBrain、RankEmbed 和 DeepRank。
网络排名只是搜索的一部分,但许多搜索功能使用网络结果来解释查询并相应地触发。
因此,帮助排名有助于一般搜索。
但除此之外,在搜索领域开发的技术已 znb 目录 经在整个公司范围内扩展到广告、YouTube、Play 和其他地方。
所以我不是从事金融工作的,但总的来说,我认为谷歌的大量业务与排名中日志的使用有关。”
6. 移动端和桌面端排名
本新闻稿深入探讨了移动和桌面搜索排名、用户意图和用户满意度之间的差异——有时移动流量开始超过桌面访问流量。
谷歌比较了这些指标,包括:
- 点击率
- 手动微调
- 查询每个任务
- 查询长度(以字符为单位)
- 查询长度(以字为单位)
- 放弃(跳出率)
- 平均点击位置
- 复制
根据这些发现,其中一项建议是:
“不同的移动评级或信号反映了不同的目的。移动查询通常有不同的意图,我们可能需要将反映这些意图的附加或附加信号合并到我们的排名框架中。如前所述,希望这些信号能够正确处理本地级问题。
链
7. 向 Sundar 展示的要点
这份文档并没有什么令人惊讶的(目前还不清楚是谁写的),但是关于 BERT 和搜索排名有一个有趣的点: