数据科学实战之网络爬取:Python实践和示例
Authors: Seppe vanden Broucke, Bart Baesens
Publisher: Apress
Get it on: Amazon
本书提供了一个完整的、现代的Web抓取指南,使用Python作为编程语言,专为数据科学的读者编写,探讨了Web抓取和以及其背后的大量Web技术。书中首先简要概述抓取和现实生活中的用例,解释了HTTP、HTML和CSS的核心概念作为基础。最后总结了一些最佳实践和一系列的例子,这些数据科学用例汇集了你学到的所有知识。读者将学习到如何利用已建立的最佳实践和常用的Python包,处理包括JavaScript、Cookie和常见的web抓取技术。