selenium 破解 cloudflare 5秒验证
cloudflare 5秒验证破解
1、在被cloudflare保护的网站爬取数据的时候,首次请求会出现503
不携带COOKIE 即出现503
2、cookie 具有时效(具体时效未曾测试)
3、selenium 无头模式被 cloudflare 拿捏了,
根据 https://zhuanlan.zhihu.com/p/542766089 博文技术讲解,方法测试如下
Undetected-chromedriver 过 5s验证
import undetected_chromedriver as uc |
实际情况,我发现在首次登录之后,取得 cookie 再次使用 requests 访问时,即可正常获取到数据
但是 重点来了 !!!
我们平常都是在服务器上跑 python 代码,而服务器 当然绝大多数是不会使用显示器的, 而 cloudflare 却在 JS 中添加了检测显示器的代码。
然后…. 是不是有一种东西 可以让 python 暂时使用 一个伪造的 显示器环境?
还真有!!!
centos7安装 虚拟显示器环境 Xvfb
yum update |
正常使用代码
import time |