原创高端网站建设,匠人匠心品质保障

百度蜘蛛抓取导致流量暴增的原因

04
2020-03

BaiduSpider对网站抓取数量突增往往给站点带来很大烦恼,纷纷找平台想要Baiduspider IP白名单,但实际上BaiduSpider IP会随时变化,所以并不敢公布出来,担心站长设置不及时影响抓取效果。百度是怎么计算分配抓取流量的呢?站点抓取流量暴增的原因有哪些呢?


百度蜘蛛抓取导致流量暴增的原因_技术分享_天津匠人匠心网络科技有限公司


    请来看官方如何解释:


    总体来说,Baiduspider会根据站点规模、历史上网站每天新产出的链接数量、已抓取网页的综合质量打分等等,来综合计算抓取流量,同时兼顾站长在抓取频次工具里设置的、网站可承受的抓取值。


    从目前追查过的抓取流量突增的case中,原因可以分为以下几种:


    1、Baiduspider发现站内JS代码较多,调用大量资源针对JS代码进行解析抓取。

    2、百度其他部门(如商业、图片等)的spider在抓取,但流量没有控制好。

    3、已抓取的链接,打分不够好,垃圾过多,导致spider重新抓取。

    4、站点被攻击,有人仿冒百度爬虫(相关阅读《如何正确识别Baiduspider移动ua》)。


    如果站长排除了自身问题、仿冒问题,确认BaiduSpider抓取流量过大的话,可以通过反馈中心来反馈给百度官方,切记一定要提供详细的抓取日志截图。


天津市匠人匠心科技有限公司
天津网站建设品牌—— 匠人匠心
顾问:138-2142-0129


天津网站建设 天津网页设计 网站制作(http://tjdzwz.com)

原创高端网站建设,匠人匠心品质保障

我们的愿景:
成为最受人尊敬、最具影响力的互联网企业

我们的使命:
提升企业品牌形象获得最大的价值

我们的价值观:
诚信、专注、尽责、创新

联系我们

我们在路上,你在哪

选择我们的六大理由

一直行业专注;千家成功案例;标准的合作流程;专业的业务流程;优秀的设计团队;完善的售后服务