2016年6月30日百度官方宣布已经对Spider2.0进行全面升级到Spider3.0,其意义在于收录问题上的解决,以往百度在收录方面是比较慢的,而且非常差劲,10篇有一篇收录已经很是万幸了,这还不是重点,对于内容原创没有给予更高排名,这就是一些站长憋屈的地方,凭什么别人转载我的文章,反而排名比我好呢?所以针对此,百度Spider3.0升级由此而来,其内容要点体现在4个方面。
其一 主动提交链接工具,实时抓取
主动推送工具基本原理是主动推送工具获取16个英文数字组合的字符串,制作数据推送接口,实现最快速度的数据推送。自工具推出以来,每天的数据提交量已超过上千万,并且值得庆幸的是提交数据平均被抓取时间早于爬虫发现时间4个小时,当天的收录网页量可达到60%~100%,这也说明了这个功能还是有点用的。


其二 第一时间发布内容站点并且收录,将会得到优先排名
要知道之前在2.0的时候一些中小站长即使写出高质量的文章,如果被一些高权重的网站抄袭或者转载之类的,自己辛苦写的东西可能就不能得到很好的排名,也就是在流量方面比不上别人抄袭的来的快。不过3.0高效的提交工具改变了这个现状,至少没有以前那么严重了。还有就是关于文章的时效性,也就是时间越靠近,排名越靠前,这一类站点当然非新闻源站点莫属,只有高频率的文章更新才能有此待遇,当然这也是离不开主动提交工具的。
其三 抓取和建库加快
经过升级Spider3.0,当前百度对于链接的发现也是越来越快速了,特别是在抓取和建库的速度大大提高了,抓取和建库是采取了强大的机器学习模型,来进行链接的质量预测,对库中所有链接进行全局排序,对有价值链接的召回率提高到了95%,在索引方面,由原来的10天左右,提升到了40%~80%。
其四 死链处理更高效
未升级之前百度对于死链的处理速度是相当慢的,包过对于死链的识别也是非常愚钝的,因此这也给一些黑帽者提供了窃机,当然升级之后变得好多了,不仅能够识别协议死链,以及大多数内容死链,还能识别跳转死链等地质网页,对于快照的删除也是非常快的。
总之,度Spider3.0的到来,无疑给各位站长带来了巨大的福利,这也是百度所期待的一样,打造优质的内容生态,促进互联网搜索健康发展。
顶一下
(0)
踩一下
(0)