python爬虫防止IP被封的一些措施（爬虫ip被限制了怎么办）-FinClip官网

python爬虫防止IP被封的一些措施（爬虫ip被限制了怎么办）

网友投稿 2610 2022-09-23

python爬虫防止IP被封的一些措施（爬虫ip被限制了怎么办）

在编写爬虫爬取数据的时候，因为很多网站都有反爬虫措施，所以很容易被封IP，就不能继续爬了。在爬取大数据量的数据时更是瑟瑟发抖，时刻担心着下一秒IP可能就被封了。

本文就如何解决这个问题总结出一些应对措施，这些措施可以单独使用，也可以同时使用，效果更好。

伪造User-Agent

在请求头中把User-Agent设置成浏览器中的User-Agent，来伪造浏览器访问。比如：

headers ={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'} resp = requests.get(url,headers = headers)

还可以先收集多种浏览器的User-Agent，每次发起请求时随机从中选一个使用，可以进一步提高安全性：

把上面随机选择一个User-Agent的代码封装成一个函数：

注：一些常见浏览器的User-Agent可参见：https://blog.csdn-/qianxing111/article/details/79415857

在每次重复爬取之间设置一个随机时间间隔

比如：

time.sleep(random.randint(0,3)) # 暂停0~3秒的整数秒，时间区间：[0,3]

或：

time.sleep(random.random()) # 暂停0~1秒，时间区间：[0,1)

伪造cookies

若从浏览器中可以正常访问一个页面，则可以将浏览器中的cookies复制过来使用，比如：

注：用浏览器cookies发起请求后，如果请求频率过于频繁仍会被封IP，这时可以在浏览器上进行相应的手工验证（比如点击验证图片等），然后就可以继续正常使用该cookies发起请求。

使用代理

可以换着用多个代理IP来进行访问，防止同一个IP发起过多请求而被封IP，比如：

附：GitHub上的一个"反反爬虫"项目

道高一尺魔高一丈，你有反爬虫措施，那我也有各种"反反爬虫"的措施，GitHub上就有一位大神专门整理了一个这样的项目：Anti-Anti-Spider，链接地址为：https://github.com/luyishisi/Anti-Anti-Spider可以研究一下。

微前端架构如何改变企业的开发模式与效率提升

2610 2022-09-23

python爬虫防止IP被封的一些措施（爬虫ip被限制了怎么办）

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计