发新帖

Google通过提交表单抓取新页面

7117 25
Google固然已经是抓取页面最多的引擎,但照样不知足,因为有很多网页和信息是很难被发明和抓取的。这也就是为什么做网站时必定要留意引擎友爱。


如今Google开端供给提交表单(form)发明厥后的网页。本想写个具体解释,刚好看到幻灭已经写了,就直接引用重要内容如下。




            
Matt Cutts也写了个帖子举例解释这么做的好处。有很多网站首也执偾以表单方法列出公暗里属的各地区分站,没有以链接情势列出各分站。这种网站以前是不克不及被深度收录的,因为Google不提交表单,就发明不了隐蔽在表单后面的URL。


据Google所述,当前Googlebot正对一小部分高质量网站进行表格提交的实验。当Googlebot发明这些网站上有HTML表格时(即检测到时),它就会主动大年夜网站上选择一些词语输入表格的文本框里,然后再选择不合的按钮、勾选项及验证项,再提交表格。提交表格后一旦 Googlebot认为出现的新内容是合法并且是有趣及独特的,它就可能会把内容抓取进Google的结不雅索引数据库里。这意味着Googlebot 如今已司懂得经由过程提交蓖ㄐ砒获得新内容。

            
同时Google也强调,如不雅网站的robots.txt文件里禁止了对表格进行了隐蔽,不欲望表格提交后所产生的链接被抓取,那Googlebot 是不会抓取的。此外,当前Googlebot只提交GET类型的表格。比如当表格须要输入用户小我信息比如暗码、用户名、接洽人等,Googlebot是 会主动略过这些表格的。

            
这肿莨狁抓取当前只是一个小范围的实验,Google表示不会对网站造成影响。既不会对网站的PR值袈潇成影响,也不会对网站的┞俘常抓取、排名等造成影响。

            




之前我们已经知道Googlebot除了能抓取文本、视频、音频、Flash等类型的内容外,它还可以经由过程JS代码抓取链接。并且在将来,Googlebot还有望直接辨认图片及视频狼9依υ?字。为了进一步抓取互联网的内容,Google宣布Googlebot已可经由过程提交表格抓取更多内容。

            
这当然给一些网站的收录创造了机会,是否也会对某些公司网站带来必定的安然风险?网站某部分不想被收录的话,赶紧用robots.txt文件禁止吧。

精彩评论25

SEO服务   学习于  2016-6-14 20:12:11
很不错
SEO优化   学习于  2016-6-14 20:54:27
顶顶多好
SEO外包   学习于  2016-6-14 20:16:03
真心顶
网站SEO优化   学习于  2016-6-14 20:22:14
说的非常好
SEO外包   学习于  2016-6-14 20:31:27
很好哦
土豆网   学习于  2021-3-1 22:30:20
网站优化排名外包公司
绝世唐门   学习于  2021-3-3 15:18:44
城固网站排名优化公司
美团   学习于  2021-3-5 05:38:59
工装装修公司网站优化案例
如果爱   学习于  2021-3-8 15:47:10
榆林网站建设优化公司