发新帖

Google工程师 讲述网页搜索排名背后的技术

6427 25
这是 Google 工程师 Amit Singhal 揭橥在 Google 官方博客的一篇文┞仿,讲述了 Google 排名背后的一些技巧,涉及到 Google 对网页,对语义,对用户意图的懂得。


Google 排名的核心技巧源自已有50年汗青的学术课题 Information Retrieval (IR),IR 技巧应用统计学道理对文字的应用频率等属性进行研究并对结不雅进行排名。建立在 IR 理论上的 Google 同时借助链接,网页构造等等技情况成独特的技巧。


懂得网页:


懂得语义:


Google 可以经由过程用户供给的几个关键词,懂得用户的┞锋实意图。他们在拼写改┞俘,词义,以及概念分析方面处于异常领先的地位。很多人都或多或少体验过 Google 的拼写改┞俘功能,比如 "kofee annan",Google 会问你的是否 "kofi annan",然而,当有人 "kofee beans",Google 会改┞俘成 "coffee beans"。(Google 事实上已经在测验测验语义技巧 - 译者)


                                                               
词义是 Google 测验测验懂得萌芽语义的基本,也是 Google 碰到的最大年夜难题。一些在人看来显而易见的器械,机械却很难主动处理。用户并不想对应用什么词汇进行萌芽而操心,人们甚至压根不知道该应用什么进行萌芽。在这种时刻,Google 的词尸体系便可以发患咀用,词尸体系可以对萌芽语句进行异常复杂的修改,比如,萌芽 "Dr Zhivago" 的时刻,Google 知道 Dr 代表 Doctor ,而萌芽 "Rodeo Dr" 的时刻,Dr 代表 Drive。用户 "back bumper repair" 的时刻,结不雅是 rear bumper repair,而 "Ramstein ab",Google 可以或许将 ab 懂得成 Air Base,"b&b ab" 会懂得为 Alberta 的 Bed and Breakfasts 。Google 将这种词义懂得体系成长到上百种不合说话。


Google 在排名中应用的另一项技巧是概念辨认,该技巧可以对萌芽的内容进行概念辨认,比如,我们萌芽 "new york times square church",Google 知道我们实际膳绫侨芽的是纽约时代广场上的那座有名教堂,而不是纽约时报中的某篇文┞仿。概念辨认技巧并不止这些,Google 还对其进行加强以精确地辨认语义,比如, &quotC and its impact on people",事实上是计算机对社会的影响。Google 的分析算法中这类技巧比比皆是,并且面向几乎所有说话。


懂得用户:


Google 多年来在收集爬虫与索引体系上投入巨资,是以,Google 拥有异常宏大年夜并且是最新的网页索引,除此之外,Google 还应用一些最新技巧进步索引质量,比如,他们开辟了一种技巧,可以在字面意思之外懂得一个网页所表达的重要概念,人们应用意大年夜利说话 "galleria sprovieri londra",会找到伦敦的 Sprovieri Gallery,尽管 Sprovieri Gallery 主页上既没有 London,也没有 Londra 字样。在美国,人们 "cool tech pc vancouver, wa",会找到 www.cooltechpc.com,然而 www.cooltechpc.com 的主页膳绫腔有任何文字注解他们位于 Vancouver。其它技巧包含,区分一个网页中的重要或非重要文字,以及网页内容的新鲜度。


Google 测验测验懂得用户的目标是为用户返回他们真正须要的结不雅,而不是他们在语句中所说的器械。该技巧基于一个世界级的本地化体系,外加先辈的个性化技巧,以及各类用户意图辨认技巧。


Google 对本地结不雅的看重表如今他们的本地化工作中。同样一个萌芽语句在不合国度会返回不合结不雅,比如,萌芽 "bank]",在美国返回的是银行,而英国则可能是 Bank Fashion 的服装连锁店,或者英国的银行,而在其它英语国度,如澳大年夜利亚,加拿大年夜,新西兰,南非,返回的则应仍然是本地的银行。如不雅你在一些非英语国度萌芽这个词,象埃及,以色列,日本,俄罗斯,沙特,瑞士,返回的结不雅将更有趣。就象 Football 在美国和英国表示不合的活动项目一样,同一个词在不合国度萌芽的结不雅可能截然不合。


个性化萌芽是 Google 另一项先辈技巧,一个已经登录的用户,如不雅?通了 Web History 办事,跟着他萌芽时光的增长,Google 会根据他的萌芽汗青,主动调剂返回的结不雅,比如,一个经常萌芽 Football 相干话题的人,会逐渐大年夜 Google 获得更多足球相干的结不雅。如不雅你青睐某个购物站返回的结不雅,在今后的萌芽中,会大年夜那个购物站获得更多结不雅。


Google 在返回用户真正想要的结不雅方面的另一个例子是,假如你 "chevrolet magnum",我们知道 Magnum 不是 Chevrolet 产的,是 Dodge 产的,Google 会主动返回 dodge magnum 的结不雅。还有一个例子,有人 "bangalore",不仅返回 Bangalore 这个城市的主页,并且返回 Bangalore 的地图,以及一些与 Bangalore 市景,交通相干的视频,这些视频会让你怀孕临其境的感到。


本文国际来源:http://googleblog.blogspot.com/2008/07/technologies-behind-google-ranking.html


中文翻译:COMSHARP CMS 官方网站

精彩评论25

qsgpd   学习于  2016-7-3 09:09:46
这篇seo文章很不错
qsgpd   学习于  2016-7-3 09:28:45
楼主是优化界超人
jn7   学习于  2016-7-3 08:48:41
顶顶多好,多学点优化技巧
tk6j   学习于  2016-7-3 08:45:33
技术和方案都很好哦
68ue   学习于  2016-7-3 08:59:35
LZ真是SEO的人才
晋济高速事故   学习于  2021-2-22 20:18:49
宝山区网站关键词优化公司
直播吧   学习于  2021-2-23 08:16:45
网站seo优化排名公司
天天向上   学习于  2021-2-23 08:54:09
三门峡网站建设优化公司
青川地震   学习于  2021-2-25 04:04:51
淄博推广优化网站公司