发新帖

什么是代理劫持

2473 5
像PR劫持一样,对一些比较难以预防的黑帽谗谄手段,本来不太想积极评论辩论,因为有很多时刻会对无辜的┞肪长造成很大年夜的伤害。


国内站长对代劳办事器(proxy server)肯定都很熟悉。在应用代劳办事器上其他网站时,浏览器显示的URL平日是类似于:


在前两天的引擎优化案例中,提到了代劳劫持(proxy hijack),有人问是怎么回事,今天就解释一下。像这种器械都是双刃剑,不怀好意的人看了,又多了一个损仁攀利己的对象。另一方面,已经深受其害的┞肪长看了,也许对他们预防和恢复竽暌剐正面意义。


http://www.proxysite.com/proxy/www.proxysite.com


个中proxysite.com是代劳办事器域名,proxysite.com是真正要拜访的网站。


在浏览器打开这种URL当然没问题,但如不雅引擎抓取了这种URL,就会对本来的网站形成完全复制内容网页。固然复制内容网页在绝大年夜部分情况下只是被忽视不计,但在某些情况下,引擎断定缺点,会把原始的版本当做是复制而被处罚甚至被删除。


一般情况下,经由过程代劳拜访的URL不该该被收录。但如不雅有人恶意链接向这个代劳URL,引擎也会拜访和抓取。


怎么预防或恢复被代劳劫持的排名呢?


最简单的,如不雅看到本身的网页被代劳劫持,查一下那个代劳办事器的IP地址,本身办事器上把那个IP地址樊篱掉落,禁止抓取。


但有的时刻,代劳办事器的IP地址会有变更,并且代劳办事器又那么多,很可能樊篱不过来。更复杂的办法是办事器端经由过程法度榜样辨别来拜访的是否是引擎蜘蛛,是否是真正的引擎蜘蛛。


有些情况下,引擎蜘蛛经由过程代劳URL拜访时的浏览器类型(User Agent),照样引擎的蜘蛛。不过,有的代劳办事器可能设置为隐蔽原始IP地址,隐蔽User Agent,这就给断定是否是引擎蜘蛛造成很大年夜艰苦。


代劳劫削发单说就是引擎收录了经由过程代劳办事器浏览的网页,而把本来真正的网页处罚或删除。


这时网站法度榜样就须要主动验证来访的是否是真的引擎蜘蛛。如不雅法度榜样考验确切是真实的蜘蛛,就返回正常页面。如不雅检测不是蜘蛛是正常用户,或是假装的蜘蛛,那么返回的网页都参加noindex,nofollow标签。如许这些原始网页经由过程代劳拜访时,都不克不及被引擎所抓取。


Google2月份揭橥在黑板报及网站治理员博客的翻译Matt Cutts的如何验证Google蜘蛛帖子(Matt  Cutts的原贴没发在本身的博客,而是发在英文版网站治理员博客),不是发着玩的,而是有很深的意义。大年夜今朝零个引用链接和评论看,大年夜部分人不知道这个帖子有什么竽暌姑。


按说引擎对这种代劳劫持应当有办法断定,不然这就成了一些人可以谗谄竞争敌手的简略单纯办法。不过,任何算法都有马脚,就算算法能99%的┞俘确断定,然则漏网的那一个缺点就可能使无辜的网站被删除。


写这篇文┞仿是欲望介绍给跟多人,让大年夜家能更好的预防。应用这种方僧衣图谗谄他人,信赖大年夜家都邑十分小看的。


很少写帖子时想,看懂的人越少越好。这是一篇。

精彩评论5

b3j   学习于  2016-6-29 13:16:37
这篇seo文章很不错
qsgpd   学习于  2016-6-29 13:46:18
好帖就是要顶
iem6h   学习于  2016-6-29 13:54:42
顶顶多好,多学点优化技巧
6i0g1   学习于  2016-6-29 13:26:47
技术和方案都很好哦
5800   学习于  2016-6-29 13:52:21
不错不错这下会优化网站了