网站假设使用的是虚拟空间,那么都会有流量,假如大部分的流量都被蜘蛛消耗掉,那么我们就需要额定花费一些钱去购买流量了。假设一个网站很多流量都是蜘蛛抓取所消耗的,有哪些技巧和办法能够约束而不影响搜索引擎优化作用呢
1找出虚假蜘蛛进行屏蔽。通过网站日志分析,我们能看到是真实的搜索引擎蜘蛛还是虚假的,如果是虚假的我们一定要做好屏蔽。
2屏蔽无效的蜘蛛或对搜索引擎优化作用小的搜索蜘蛛。虽然这样并不是好的解决方法,但是如果你只是针对一个或几个搜索引擎来做优化的话,其余的搜索引擎蜘蛛是完全可以屏蔽掉的。
3用robots文件约束无效页面或重复页面的抓取。比如404页面,蜘蛛也是很喜欢抓取的,这样的页面要及时屏蔽掉,不然很消耗流量。
4设置页面的抓取频率和抓取速度,没必要时时刻刻都需要蜘蛛来抓取,而且很多地方是属于无效的内容,需要进行精简。
5外部调用或cdn加速来提升蜘蛛的抓取,减少服务器的响应和流量消耗。现在的网站大多使用很多图片视频等多媒体来展现,而这些图片需要较多的下载流量,假如我们把图片使用外部调用的办法,那么就能够节约很多的蜘蛛抓取流量。
当然在实践中我们也能够依据自身实践需求来处理,比如可以对一些抓取量过大的栏目在sitemap设置较低的抓取频率对一些重要的内容假如收录不好的话也能够添加外链或内链来增加抓取等。