Python利用grequests轻松实现高并发爬虫

liftword18小时前技术文章5

图/文:迷神

Python爬虫必备知名类库:requests基本上人人皆知了,K神编写,是Python发送接口请求简单,非常好用的一个三方库。但是requests发送请求是串行的,即阻塞的。发送完一条请求才能发送另一条请求。

为了提供效率,我们一般都要使用并发请求。当然,可以使用多线程,或者协程,gevent或者aiohttp,但是太麻烦了,而且由于python的GIL锁的原因,多线程也是伪多并发。

于是,K神基于gevent+requests编写的一个并发发送请求的库:grequests,支持python2/3

使用起来非常简单。

grequests安装方法:

安装方法:

pip install gevent grequests

项目地址:
https://github.com/spyoungtech/grequests

grequests简单使用

构造一个请求列表,使用grequests.map()并行发送,代码如下:

import grequests
req_list = [   # 请求列表,支持get post put  等多种方法
    grequests.get('http://www.toutiao.com/get?a=1&b=2'),
    grequests.post('http://www.toutiao.com/post', data={'a':1,'b':2}),
    grequests.put('http://www.toutiao.com/post', json={'a': 1, 'b': 2}),
]
res_list = grequests.map(req_list)    # 并行发送,等最后一个运行完后返回
print(res_list[0].text)  # 打印第一个请求的响应文本

grequests使用比较简单,基本上和requests基本一致,剩下遍历:res_list就好

grequests和requests性能对比

我们以请求github为例:

import requests
import time
start = time.time()
res_list = [requests.get('https://github.com') for i in range(100)]
print(time.time()-start)

requests请求大约需要100秒左右,还是比较慢的

import grequests
import time
start = time.time()
req_list = [grequests.get('https://github.com') for i in range(100)]
res_list = grequests.map(req_list)
print(time.time()-start)

grequests请求大约4秒左右。。对,就是这么快,主要是grequests并行异步的请求。请求好了,之后我们就可以遍历结果,以进行匹配解析都是正常爬虫蜘蛛进行的操作流程了

for i in res_list: 
    print(i.text)
	  #这里可以自由发挥啦

有问题,可以留言,觉得不错,关注哦。

相关文章

Python实现串口助手 - 03串口功能实现

 串口调试助手是最核心的当然是串口数据收发与显示的功能,pzh-py-com借助的是pySerial库实现串口收发功能,今天痞子衡为大家介绍pySerial是如何在pzh-py-com发挥功能的。一、...

齐安安小课堂 | 串口数据抓取以及串口数据模拟

各位同学们好,好久不见!齐安安小课堂又双叒叕开课啦~本期来讲讲在工控现场使用的设备中有哪些普遍存在又容易被忽视的安全隐患只有重视每一个小细节才能对工业安全做出更好的防护哦~引言在工控现场中,存在着几乎...

200行Python代码实现串口调试助手之联合调试

软件开发离不开调试,调试手段分两种:一是黑盒调试,即直接从输入 / 输出角度测试软件功能是否正常,这种方式仅能发现问题,但无法直接定位问题原因所在;二是白盒调试,即直接拿源代码在线 debug,pyt...

200行Python代码实现串口调试助手之环境搭建

在写 pzh-py-com 时需要先搭好开发和调试环境,下表列出了开发过程中会用到的所有软件/ 工具包:一、涉及工具列表二、开发环境搭建(Python + pySerial + wxPython +...

同事开玩笑说:你这个python程序要是外流出去了,可能会有危险

引言公司因为业务原因,购入了一些高灵敏高精度的振动传感器。老板说:“拿去进行测试,看看数据如何?”吭哧吭哧接入数据,一看,确实精度和灵敏度非常高。具体多高呢?将传感器固定在相关的结构物上,在办公室中人...

Python实现串口助手 - 02界面构建

今天给大家介绍的是串口调试工具pzh-py-com诞生之界面构建。  一个软件的UI界面是非常重要的,这是软件与用户交互的接口,软件功能即使再强大,但如果没有清晰的UI界面,那也发挥不出软件的功能,使...