urllib
urllib是Python自带的爬虫库
常用urllib.reqeust, urllib.parse
使用流程:
指定url
基于urllib的request子模块发起请求
获取响应中的数据值
持久化存储
代理
正向代理:代理客户端获取数据。正向代理是为了保护客户端防止被追究责任。
反向代理:代理服务器提供数据。反向代理是为了保护服务器或负责负载均衡。
Last updated
urllib是Python自带的爬虫库
常用urllib.reqeust, urllib.parse
使用流程:
指定url
基于urllib的request子模块发起请求
获取响应中的数据值
持久化存储
正向代理:代理客户端获取数据。正向代理是为了保护客户端防止被追究责任。
反向代理:代理服务器提供数据。反向代理是为了保护服务器或负责负载均衡。
Last updated