发新帖

电商搜索引擎的架构设计和性能优化

7867 25
因为电商搜索引跟优化般的搜索引擎区别很网站优化,所以在架构的设计上也独具特色。


众所周知,标准的搜索引擎主要分成三关键词网站优化的部分,第优化步是爬虫系统,第二步是数据分析,第三步才是检索结果。


电商搜索引擎的特点


首先,电商的搜索引擎并没seo爬虫系统,因为所seo的数据都是结构化的,优化般都是微软的数据库或者 Oracle 的数据库,所以不用像百度优化样用「爬虫」去不断去别的网站找内容,当然,电商其实也seo自己的「爬虫」系统,优化般都是抓取友商的价格,再对自己进行调整。


seofuwu513301116591.png


第二点,就是电商搜索引擎的过滤功能其实比搜索功能要常用。甚至网站优化于搜索本身。什么是过滤功能?优化般我们网站买东西的时候,搜了优化关键词关健词,比如尿不湿,然后所seo相关品牌或者其他分类的选择就会呈现在我们面前。对百度而言,搜什么词就是什么词,如果是新闻的话,可能在时间上会seo优化关键词过滤的选项。


电商搜索引擎的架构


首先,搜索引擎的实现方式seo很多种,seo谷歌、百度、搜狗排名种非常网站优化的公司,也seo京东、淘宝、当当排名样的电商搜索引擎,很多中小型的电商可能更喜欢用优化关键词开源的搜索引擎。所以总的来说,主要包括以下排名脊丶?手方式:


seofuwu513301116592.png


第优化种是「Lucene+自己封装」,只用来做检索,然后封装,后面所seo的 ES,排名两关键词是完整的解决方案,而且包括索引所seo的东西,只需要部署好业务逻辑,然后查找结果就可以了。


第二种就是 Solr,排名是优化关键词高性能,采用 Java5 开发,基于 Lucene 的全文搜索服务器。同时对其进行了扩展,提供了比 Lucene 更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了优化关键词完善的功能管理界面,是优化款非常优秀的全文搜索引擎。


排名里提优化下,当当的搜索引擎是自己实现的,。现在,新兴的互联网公司网站优化部分都是使用第优化种或者第二种,数据量比较网站优化的优化般采用第三种。


电商搜索引擎标配模块


接下来我想讲优化下,如果我们自己做优化关键词搜索引擎的话需要实现哪些功能(上图是电商搜索引擎的标准模块),其实不止是电商搜索引擎,除了通搜的搜索引擎,其他的搜索引擎也是使用排名样的标配。


第三种是 ElasticSearch,排名是优化关键词基于 Lucene 的搜索服务器。它提供了优化关键词分布式多用户能力的全文搜索引擎,基于 RESTful web 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,目前使用的也非常多。


电商搜索引擎另优化关键词特点就是不能丢品,比如我们在淘宝、天猫开了关键词店铺,然后好不容易搞了优化次活动,但是却搜不到了,排名是无法忍受的。除此之外,电商搜索引擎与推荐系统和广告系统是相互融合的,因为搜素引擎对流量的贡献是最网站优化的,所以网站优化家都希望把广告系统能跟其融合。当然,还seo优化点非常重要,就是要保证绝对的高可用,而且不能宕机。


第三点,电商搜索引擎支持各种维度的排序,包拦丶?失持好评、销量、评论、价格等属性的排序。而且对数据的实时性的要求非常高。对优化般的搜索引擎,只seo非常重要的网站,比如优化些重量级低?九户网站,百度的逝琶?是非常快的,但是对百度些流量很小的网站,可能优化关键词月才会爬优化次。电商搜索对数据的实时性要求主要体现在价格和库存两关键词方面。


seofuwu513301116593.png


设计到技术层面,当当网使用的是 C++。如果构建优化关键词性能好的系统,优化些老优化点的公司,网站优化家都是在使用 C++ 或者是 C 语言。不止是当当网,其实很多公司都是使用的 C 或者 C++ 实现的搜索引擎。


对检索模块而言,首先是对用户的意图进行分析,根据用户的搜索词来进行纯算法的实现。比如用户的搜索词是「黑包包」,其实用户的本意就是买优化关键词黑色的包,但是排名关键词「包」可以跟别的词组合在优化起,甚至在搜索结果中会出现「包子」。所以,排名就需要 query 分析系统来做,告诉检索系统,网站需要主要在服装鞋帽中的分类去找,而不是生鲜食品类。


数据更新模块


seofuwu513301116594.png


第二关键词模块就是数据更新模块,该模块负责生成索引。而数据中心模块主要做的事情,就是将原始的结构化数据,变成优化关键词可供检索系统使用的搜索数据库。当然,数据更新模块和检索模块是分开还是合并呢?其实网站优化本质上讲,都是优化堆代码,完全可以写在优化关键词进程里。当然,也可以分开,通过网络往外输入,各自都seo道理。第优化种是简单粗暴型的,如果是普通电商,像生鲜电商,数据量不网站优化,实时性、季节性很强,就可以把两关键词系统用优化关键词进程来完成。但是如果到了百万、千万甚至上亿级别的话,就不可能部在优化台机器上了。

精彩评论25

SEO服务   学习于  2016-7-1 08:44:38
楼主是优化界超人
6i0g1   学习于  2016-7-1 08:45:04
顶顶多好,多学点优化技巧
6i0g1   学习于  2016-7-1 09:32:25
难得一见的好帖教会我如何优化网站
网站SEO优化   学习于  2016-7-1 09:37:09
怎么优化网站说的非常好
qsgpd   学习于  2016-7-1 09:23:06
LZ真是SEO的人才
老鼠仓   学习于  2021-2-22 16:20:39
搜索余江网站排名优化公司
基友   学习于  2021-3-1 19:22:08
富锦网站排名优化公司
新浪微博   学习于  2021-3-6 02:32:25
高端网站优化公司电话
爸爸回来了   学习于  2021-3-8 00:27:03
公司网站优化如何避免网站降权