Update 【2018-04】Python3 网络爬虫开发实战.md

82c91104 · 勤为径苦作舟 · GitHub · d1b00910 · 82c91104
隐藏空白更改
内联并排

Showing with 10 addition and 1 deletion

Books/【2018-04】Python3 网络爬虫开发实战.md Books/【2018-04】Python3 网络爬虫开发实战.md +10 -1

未找到文件。
--- a/Books/【2018-04】Python3 网络爬虫开发实战.md
+++ b/Books/【2018-04】Python3 网络爬虫开发实战.md
@@ -4,6 +4,15 @@

 　　本书介绍了如何利用 Python 3 开发网络爬虫。书中首先详细介绍了环境配置过程和爬虫基础知识；然后讨论了 urllib、requests 等请求库，Beautiful Soup、XPath、pyquery 等解析库以及文本和各类数据库的存储方法；接着通过多个案例介绍了如何进行 Ajax 数据爬取，如何使用 Selenium 和 Splash 进行动态网站爬取；接着介绍了爬虫的一些技巧，比如使用代理爬取和维护动态代理池的方法，ADSL 拨号代理的使用，图形、 极验、点触、宫格等各类验证码的破解方法，模拟登录网站爬取的方法及 Cookies 池的维护。 此外，本书还结合移动互联网的特点探讨了使用 Charles、mitmdump、Appium 等工具实现 App 爬取 的方法，紧接着介绍了 pyspider 框架和 Scrapy 框架的使用，以及分布式爬虫的知识，最后介绍了 Bloom Filter 效率优化、Docker 和 Scrapyd 爬虫部署、Gerapy 爬虫管理等方面的知识。

+## 作者简介
+
+　　崔庆才
+
+　　北京航空航天大学硕士，[静觅博客](https://cuiqingcai.com/)博主，爬虫博文访问量已过百万，喜欢钻研，热爱生活，乐于分享。欢迎关注个人微信公众号 “进击的 Coder”。
+
 # 资源

-* 在线阅读：[崔庆才的个人站点](https://python3webspider.cuiqingcai.com/)
+|书名|资源名|地址|备注|
+|---|---|---|---|
+|Python3 网络爬虫开发实战|在线阅读|[崔庆才的个人站点]([https://github.com/wesm/pydata-book](https://python3webspider.cuiqingcai.com/))||
+||关联图书|[豆瓣](https://book.douban.com/subject/30175598/)||