题名:
用Python写网络爬虫   / (德)凯瑟琳·雅姆尔(Katharine Jarmul),(澳)理查德·劳森(Richard Lawson)著 ,
ISBN:
978 7 115 47967 9 价格:
出版发行:
出版地: 出版社: 人民邮电出版社 出版日期: 2018.08
内容提要:
本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用Scrapy爬虫框架进行快速的并行抓取,以及使用Portia的Web界面构建网路爬虫。 
主题词:
工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程  
中图分类法:
TP311.561 版次: