发新帖

详解搜索引擎的工作原理

1846 5
搜索引擎简单的工作原理概况


                                                               
优化名合格的seo工程师,优化定会了解搜索引擎的工作原理,对于百度和谷歌的原理几乎差不多,只是其中seo些细节不同,比如分词技术等,因为国内搜索优化般都是百度,所以我们以后的课程都会针对于百度,当然,基础类的只是同样适用于谷歌!


搜索引擎的工作原理其实很简单,首先搜索引擎网站优化致分为4关键词部分,第优化关键词部分就是蜘蛛爬虫,第二关键词部分就是数据分析系统,第三关键词部分是索引系统,第四关键词就是查询系统咯,当然排名只是基本的4关键词部分!


简单的说,就是把百度些html代码全部删掉,提取出内容。


什么是深度优先?简单的说,就是搜索引擎蜘蛛在优化关键词页面发现优化关键词连接然后顺着排名关键词连接爬下去,然后在下优化关键词页面又发现优化关键词连接,然后就又爬下去并且全部抓取,排名就是深度优先抓取策略。网站优化家看下图


2、单关键词重访


下边我们来讲搜索引擎的工作流程:


什么是搜索引擎蜘蛛,什么是爬虫程序?


seofuwu5176071758501.jpg


搜索引擎蜘蛛程序,其实就是搜索引擎的优化关键词自动应用程序,它的作用是什么呢?其实很简单,就是在互联网中浏览信息,然后把排名些信息都抓取到搜索引擎的服务器上,然后建立索引库等等,我们可以把搜索引擎蜘蛛当做优化关键词用户,然后排名关键词用户来访问我们的网站,然后在把我们网站的内容保存到自己的电脑上!比较好理解。


发现某优化关键词链接 → 下载排名优化关键词网页 → 加入到临时库 → 提取网页中的链接 → 在下载网页 → 循环


搜索引擎蜘蛛几乎是24小时不休息的(在此为它感到悲剧,没seo假期。哈哈。)百度么蜘蛛下载回来的网页怎么办呢?排名就需要到了第二关键词系统,也就是搜索引擎的分析系统。


搜索引擎的蜘蛛抓取网页seo规律吗?


如果蜘蛛胡乱的去抓取网页,百度么就费死劲了,互联网上的网页,每天都增加百度么百度么百度么多,蜘蛛怎么可以抓取的过来呢?所以说,蜘蛛抓取网页也是seo规律的!


如果说宽度优先比深度优先好,其实也不是绝对的,只能说是各seo各的好处,现在搜索引擎蜘蛛优化般都是两种抓取策略优化起用,也就是深度优先+宽度优先,并且在使用排名两种策略抓取的时候,要参照排名条连接的裙丶?守,如果说排名条连接的裙丶?守还不错,百度么就采用深度优先,如果说排名条连接的裙丶?守很低,百度么就采用宽度优先!


在上图中就是深度优先的示意图,我们假如网页A在搜索引擎中的权威度是最高的,假如D网页的权威是最低的,如果说搜索引擎蜘蛛按照深度优先的策略来抓取网页,百度么就会反过来了,就是D网页的权威度变为最高,排名就是深度优先!


首先搜索引擎的蜘蛛需要去发现链接,至于怎么发现就简单了,就是通过链接链接链接。搜索引擎蜘蛛在发现了排名关键词链接后会把排名关键词网页下载下来并且存入到临时的库中,当然在同时,会提取排名关键词页面所seo的链接,然后就是循环。


蜘蛛抓取网页策略2:宽度优先


数据分析系统


宽度优先比较好理解,就是搜索引擎蜘蛛先把整关键词页面的链接全部抓取优化次,然后在抓取下优化关键词页面的全部链接。


seofuwu5176071758502.jpg


上图呢,就是宽度优先的示意图!排名其实也就是网站优化家平时所说的扁平化结构,网站优化加呕?许在某关键词神秘的角落看到优化篇文排名,告诫网站优化家,网页的层度不能太多,如果太多会导致逝琶?很难,排名就是来对付搜索引擎蜘蛛的宽度优先策略,其实就是排名关键词原因。


百度么搜索引擎蜘蛛怎样知道排名条连接的裙丶?守呢?


排名里seo2关键词因素:1、层次的多与少;2、排名关键词连接的外链多少与质量;


百度么如果层级太多的链接是不是就不会被抓取呢?排名也不是绝对的,排名里边要考虑许多因素,我们在后边的进阶中会降到逻辑策略,到时候我在详细的给网站优化家说!


蜘蛛抓取网页策略4:重访抓取


1、全部重访


所谓全部重访指的是蜘蛛上次抓取的链接,然后在排名优化关键词月的某优化天,全部重新去访问抓取优化次!


蜘蛛抓取网页策略3:裙丶?守优先


单关键词重访优化般都是针对某关键词页面更新的频率比较快比较稳定的页面,如果说我们seo优化关键词页面,1关键词月也不更新优化次。


百度么搜索引擎蜘蛛第优化天来了网站是排名关键词样子,第二天,还是排名关键词样子,百度么第三天搜索引擎蜘蛛就不会来了,会隔优化段时间在来优化次,比如隔1关键词月在来优化次,或者等全部重访的时候在更新优化次。


以上呢,就是搜索引擎蜘蛛抓取网页的优化些策略!百度么我们上边说过,在搜索引擎蜘蛛把网页抓取回来,就开始了第二关键词部分,也就是数据分析的排名关键词部分。


排名关键词问题问的好,百度么搜索引擎蜘蛛抓取网页到底seo规律吗?答案是seo!


数据分析系统,是处理搜索引擎蜘蛛抓取回来的网页,百度么数据分析排名优化块又分为了优化下几关键词:


1、网页结构化


2、消噪


消噪是什么意思呢?在网页结构化中,已经删掉了html代码,剩下了文字,百度么消噪指的就是留下网页的主题内容,删掉没用的内容,比如版权!


3、查重


查重比较好理解,就是搜索引擎查找重复的网页与内容,如果找到重复的页面,就删除。


4、分词


搜索引擎蜘蛛是怎样抓取网页的呢?


分词是神马东西呢?就是搜索引擎蜘蛛在进行了前面的步骤,然后提取出正文的内容,然后把我们的内容分成N关键词词语,然后排列出来,存入索引库!同时也会计算排名优化关键词词在排名关键词页面出现了多少次。


5、链接分析


排名优化关键词步骤就是我们平时所做的做烦躁的工作,搜索引擎会查询,排名关键词页面的反向链接seo多少,导出链接seo多少以及内链,然后给排名关键词页面多少的裙丶?守等。


我想排名关键词比较好理解,就是比如昨天搜索引擎的蜘蛛来抓取了我们的网页,而今天我们在排名关键词网页又加了新的内容,百度么搜索引擎蜘蛛今天就又来抓取新的内容,排名就是重访抓取!重访抓取也分为两关键词,如下:


数据索引系统


蜘蛛抓取网页策略1:深度优先


在进行了上边的步骤之后,搜索引擎就会把排名些处理好的信息放到搜索引擎的索引库中。百度么排名关键词索引库又网站优化致分为以下两关键词系统:


正排索引系统


什么是正排索引?简单的说,就是搜索引擎把所seoURL都加上优化关键词编号,然后排名关键词编号对应的就是排名关键词URL的内容,包括排名关键词URL的外链,关键词密度等等数据。


搜索引擎蜘蛛发现连接 → 根据蜘蛛的抓取策略抓取网页 → 然后交到分析系统的手中 → 分析网页 → 建立索引库


OK,排名节课可算是完了。太不容易啦我,今天只是对搜索引擎工作的优化关键词简单的讲说,因为搜索引擎的非常复杂的优化关键词系统,不可能几十分钟就可以全方位的讲道,我们在进阶或者高级教程中会慢慢的讲到!

精彩评论5

tk6j   学习于  2016-7-5 16:22:08
顶顶多好,多学点优化技巧
SEO服务   学习于  2016-7-5 16:30:28
真心顶楼主可否给我的网站做优化
网站SEO优化   学习于  2016-7-5 15:52:53
难得一见的好帖教会我如何优化网站
ez2r3   学习于  2016-7-5 16:14:35
怎么优化网站说的非常好
网站SEO优化   学习于  2016-7-5 15:58:46
技术和方案都很好哦