常见问题解答:所有关于Google RankBrain算法的信息 2016-09-02 04:09:23

$888.88
所属分类 :奇闻

谷歌使用名为“RankBrain”的机器学习人工智能系统来帮助对搜索结果进行排序

想知道它是如何工作的,并且适合谷歌的整体排名系统

以下是我们对RankBrain的了解以下信息来自三个原始来源并且随着时间的推移而更新,其中包含更新发生的注释以下是这些来源:首先是彭博的故事,它打破了有关RankBrain的新闻(另请参阅我们的写作 - 第二,谷歌现在直接向搜索引擎提供的其他信息第三,我们自己的知识和最佳假设在谷歌未提供答案的地方我们将在必要时明确使用这些来源的地方,除了一般背景信息之外,RankBrain是谷歌的机器学习人工智能系统的名称,用于帮助处理其搜索结果,正如彭博社报道的那样,谷歌机器学习向我们证实,计算机教会自己如何做某事而不是由人类教授或遵循详细的编程真正的人工智能,或简称AI,是计算机的地方可以像人类一样聪明,至少在获取知识的意义上,无论是从被教导到建立在它所知道的东西上还是建立新的联系真正的AI只存在于科幻小说中,当然在实践中,AI已经习惯了是指用于学习和建立联系的计算机系统人工智能与机器学习有何不同

就RankBrain而言,在我们看来它们是相当的同义词你可能会听到它们互换使用,或者你可能听说机器学习用来描述正在使用的人工智能方法的类型没有RankBrain是谷歌整体搜索“算法的一部分, “一个计算机程序,用于对它所知道的数十亿页面进行分类,并找到与特定查询最相关的页面

它被称为Hummingbird,正如我们过去报道的那样多年来,整体算法没有正式的名称但是在2013年中期,谷歌彻底改变了这个算法并给它起了一个名字,Hummingbird这就是我们的理解Hummingbird是整体搜索算法,就像汽车里面有一个整体引擎一样

引擎本身可能由各个部分组成,比如一个机油滤清器,一个燃油泵,一个散热器等同样,Hummingbird包含各个部分,其中RankBrain是最新的部分之一,我们知道RankBrain是整个Hummingbird算法的一部分,因为Bloomberg文章明确表示RankBrain不处理所有搜索,因为只有整体算法,Hummingbird还包含其他部分,这些部分的名称在SEO空间中很熟悉,如Panda,Penguin和Payday设计打击垃圾邮件,Pigeon旨在改善本地搜索结果,Top Heavy旨在降低广告重量级页面,Mobile Friendly旨在奖励适合移动设备的页面,Pirate旨在打击版权侵权PageRank是整体Hummingbird算法的一部分,涵盖特定方式基于来自指向他们的其他页面的链接给予页面信用PageRank是特殊的,因为它是Google给其排名算法的一个部分的第一个名称,在搜索引擎开始的时候,1998年信号是谷歌用来帮助确定如何排名网页的东西例如,它会读取网页上的文字,所以单词是一个信号如果有些单词是我n粗体,这可能是另一个注意到的信号作为PageRank的一部分的计算给页面一个PageRank分数用作信号如果一个页面被注意为对移动友好,那么另一个信号被注册所有这些信号被处理Hummingbird算法中的各个部分用于确定Google为回应各种搜索而显示哪些页面Google已经相当一致地说过有200多个主要排名信号被评估,而这些信号反过来可能有多达10,000个变化或子信号

更常见的只是说“数百”因素,正如昨天的彭博文章中所做的那样如果你想要一个更直观的信息排名指南,请参阅我们的SEO成功因素周期表:我们认为这是一个非常好的指南谷歌等搜索引擎用来帮助排名网页 从这个新系统开始,这个新系统已成为谷歌所说的第三个最重要的网页排名因素来自彭博社的文章:RankBrain是进入算法的“数百个”信号之一,用于确定结果出现在哪个Corrado表示,在搜索查询结果的几个月里,RankBrain已经成为第三个最重要的信号,他说,当这个故事最初编写时,谷歌不会告诉我们我们的假设是这样的:我的个人猜测是链接仍然是最重要的信号,谷歌以投票方式计算这些链接的方式它也是一个非常老化的系统,正如我在链接中所述:破碎的“投票箱”使用谷歌和Bing过去的文章至于第二个最重要的信号,我猜这将是“文字”,其中的文字将涵盖从页面上的文字到Google的i的所有内容解读人们进入RankBrain分析之外的搜索框的话这结果是非常正确的2016年3月,谷歌认为前两个因素是内容和链接或链接和内容,因为它不会说哪个是第一个For更多信息,请参阅我们的文章:通过向Google发送电子邮件,我收集RankBrain主要用于解释人们提交的搜索内容,以查找可能没有搜索到的确切字词的网页

是的,Google已找到超出确切数据的网页有人进入很长一段时间的术语例如,多年前,如果你输入类似“鞋子”的东西,谷歌可能没有找到说“鞋子”的页面,因为那些在技术上是两个不同的词但是“阻止”允许谷歌变得更聪明,了解鞋子是鞋子的变种,就像“跑步”是“跑”的变种谷歌也有同义词智能,所以如果你搜索“运动鞋”,它可能会理解并且你也意味着“跑鞋”它甚至获得了一些概念上的聪明才智,了解有关苹果技术公司与“苹果”相关的网页2012年推出的知识图表是谷歌成长的一种方式更聪明的关于单词之间的联系更重要的是,它学会了如何搜索“不是字符串的东西”,正如Google所描述的那样

字符串意味着只搜索字母串,例如与“奥巴马”的拼写相匹配的页面事物意味着相反,谷歌了解当有人搜索“奥巴马”时,他们可能意味着美国总统巴拉克奥巴马,一个与其他人,地方和事物有联系的真实人物

知识图谱是关于世界事物及其关系的事实数据库这就是为什么你可以做一个搜索,比如“什么时候出生的奥巴马的妻子”,并在不使用她的名字的情况下得到关于米歇尔·奥巴马的答案:谷歌已经用来改进的方法查询通常会回流到某个人在某个地方做工作,或者创建词干列表或同义词列表,或者在事物之间建立数据库连接当然,涉及到一些自动化但很大程度上,这取决于人类工作问题是Google处理了30亿次搜索每天2007年,谷歌表示,之前从未见过这些查询的20%到25%

在2013年,它将这一数字降至15%,这在昨天的彭博文章中再次使用,谷歌再次向我们证实了这一点但是15%三十亿仍然是任何人类搜索者从未输入过的大量查询 - 每天4.5亿次这些查询可能是复杂的多字查询,也称为“长尾”查询,RankBrain旨在帮助更好地解释这些查询和在某种程度上在幕后有效地翻译它们,为搜索者找到最好的页面Google告诉我们,它可以看到看似无关的模式之间的模式复杂的搜索,以了解它们实际上是如何彼此相似的这种学习反过来又可以让它更好地理解未来的复杂搜索,以及它们是否与特定主题相关最重要的是,谷歌告诉我们,它可以将这些相关联它认为搜索者最喜欢的结果的搜索组没有提供搜索组的示例或提供有关RankBrain如何猜测最佳页面的详细信息 但后者可能是因为如果它可以将模糊的搜索转换为更具体的内容,那么它可以带回更好的答案虽然谷歌没有提供搜索组,但彭博的文章确实有一个搜索的例子,其中RankBrain应该是在这里它是:食物链最高层消费者的头衔对于像我这样的外行人来说,“消费者”听起来像是对购买某物的人的参考但是,它也是消费食品的科学术语食品链中的消费者水平也是最高水平的消费者

标题 - 名称 - 是“捕食者”将该查询输入谷歌提供了很好的答案,即使查询本身听起来很奇怪:现在考虑结果与“食物链的顶级”之类的搜索有多相似,如图所示下面:想象一下,RankBrain将原始的长而复杂的查询连接到这个更短的一个,这可能更常见

它理解它们非常相似因此,谷歌可以利用它所知道的所有知识来获得更常见的查询的答案帮助改善它为不寻常的人提供的东西让我强调一点,我不知道RankBrain正在连接这两个搜索我只知道Google给出了第一个例子这只是一个例子,说明我如何使用RankBrain连接一个不常见的寻找一种常见的方法来改进事物回到2005年,微软开始使用自己的机器学习系统,称为RankNet,作为今天成为其Bing搜索引擎的一部分

最近,RankNet的首席研究员和创造者获得了荣誉但是多年来,微软几乎没有谈到RankNet你可以打赌这可能会改变当我将搜索结果放到Bing上时,这也是一个有趣的例子

谷歌的RankBrain,Bing给了我很好的结果,包括谷歌也回归的一个列表:一个查询并不意味着Bing的RankNet和谷歌的RankBrain一样好,反之亦然,不幸的是,提出一个列表很难做到这一点比较的类型谷歌确实给了我们一个新的例子:“杯中有多少汤匙

”谷歌表示,RankBrain支持澳大利亚与美国在该查询中的不同结果,因为每个国家的测量值都不同,尽管名称相似我试图通过搜索Googlecom和谷歌澳大利亚进行测试我没有看到太大的区别,我自己即使没有RankBrain,结果往往会有所不同这种方式只是因为“老式”的方式偏向于使用谷歌澳大利亚的搜索者来自澳大利亚知名网站的网页尽管我上面的两个例子不足以证明RankBrain的伟大,我真的相信它可能正在制作一个巨大的影响,因为谷歌声称该公司对其排名算法的内容相当保守它一直做小测试但它只有在有很大程度的信心时才会发起重大变化整合RankBrain,达到它应该的程度第三个最重要的信号,是一个巨大的变化我不认为谷歌会这样做,除非它真的相信它帮助谷歌告诉我们2015年初逐步推出RankBrain并且它已完全实现并且全球化几个月现在2015年10月,Google告诉Bloomberg,通常从未见过的15%查询中的“非常大一部分”由RankBrain处理简而言之,15%或更少在2016年6月,有消息显示RankBrain被用于Google处理的每个查询请参阅我们的故事:RankBrain所做的所有学习都是离线的,谷歌告诉我们这是批量的历史搜索和学习从这些预测进行测试,如果证明是好的,那么最新版本的RankBrain上线然后重复学习 - 离线 - 测试周期通常,如何改进查询 - 无论是通过词干,同义词还是现在RankBrain - 未被视为排名因素或信号信号通常是与内容相关的因素,例如页面上的文字,指向页面的链接,页面是否在安全服务器上等等他们也可以绑定到用户,例如搜索者所在的位置或他们的搜索和浏览历史记录 因此,当Google将RankBrain视为第三重要信号时,它真的意味着排名信号吗

是的谷歌再次向我们确认,有一个组件,其中RankBrain直接贡献一个页面是否排名究竟如何

是否有某种类型的“RankBrain得分”可能会评估质量

或许,但看起来RankBrain似乎更有可能帮助谷歌根据他们所包含的内容更好地对网页进行分类RankBrain可能能够更好地总结网页的内容,而不是谷歌现有的系统已经完成或者谷歌没有说任何其他内容谷歌告诉我们想要学习单词“向量”的人 - 单词和短语可以在数学上连接的方式 - 应该查看这篇博文,其中讨论了系统(未命名为RankBrain)在帖子中)只是通过扫描新闻文章了解了各国首都城市的概念:这里有一篇较长的研究论文

你甚至可以使用谷歌的word2vec工具玩你自己的机器学习项目

此外,谷歌有一个整个区域与人工智能和机器学习论文一样,微软也一定要看到我们的文章,机器学习如何工作,由谷歌解释注:这个故事自2015年10月最初发布时进行了修订,以反映最新信息