用Python写网络爬虫(第2版)
人文社科 Katharine Jarmul 扫描二维码
用Python写网络爬虫(第2版)
  • 书名:用Python写网络爬虫(第2版)
  • 作者:Katharine Jarmul
  • 标签: 程序语言
  • 评分:
  • 日期:2024-05-21
  • ISBN:9787115479679
内容简介

本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。

微信扫描右侧二维码,回复“验证码”即可获取!