这本书涵盖了ipython notebook、Numpy、Scipy和Pandas包的使用等,只要掌握了python语法就可以学习。
2、《Python Cookbook》
这本书介绍了Python应用在各个领域中的一些使用技巧和方法。
3、《Python数据处理》
教你如何利用语法简单、容易上手的Python轻松处理数据。
加米谷大数据开发9月零基础班,已开课可试听;大数据分析10月零基础班,预报名中…
相关:
大佬们推荐的Python书单汇总
https://www.toutiao.com/i6649565082718044680/
未来最大的能源不是石油而是大数据。对大数据的获取、处理与分析,以及基于大数据的智能应用,已成为提高未来竞争力…
回答之前,先有情提醒一句,「虫有风险」,刑法已明确非法获取计算机信息系统数据罪。大家先来看看善意爬虫和恶意爬虫的区分:
善意爬虫,比如百度搜索引擎的爬虫,严格遵守Robots协议规范爬取网页数据(如URL),它的存在能够增加网站的曝光度,给网站带来流量。恶意爬虫,它无视Robots协议,对网站中某些深层次的、不愿意公开的数据肆意爬取,其中不乏个人隐私或者商业秘密等重要信息。Python爬虫,不懂Python可以吗?不懂HTTP基础可以吗?不会基本的抓包工具你能玩通爬虫吗?一图胜前言,大家先来看看python爬虫都涉及哪些方面的知识:
言归正传,有什么好的资料推荐呢?下面说说自己的看法。
1、Python 3网络爬虫开发实战豆瓣评分8.9分,全书以python3为基础,从基本的开发环境、常用的爬虫库开始,对爬虫过程涉及的基础知识HTTP、Web基础、代理进行了介绍,接下来详细讲解python中urllib、requests、正则等基础库的用法,并以实例「抓取猫眼电影排行」为例讲解。
文中的内容不仅涉及爬虫过程中代理的处理,验证码的识别,模拟登陆过程,更介绍了移动时代下APP数据的爬取,最后介绍了Scrapy框架,分布式爬虫的原理及部署。
具体内容可见上图PDF,如果有需要这本书的童鞋,可关注+留言获取。
2. 爬虫实战篇talk is cheap,show me the code!
这里直接推荐Github的开源项目「awesome-python-login-model」,这里就不再贴地址了,大家直接去git上搜索即可。使用python模拟登陆一些大型网站,还有一些简单的爬虫。
眼过千遍不如手过一遍,多动手实践,多多debug,永远是提升自己编程技能的铁的定律 !
由于其丰富的第三方框架,python非常适用于进行数据挖掘,利用python进行数据挖掘包括数据处理及算法实现,其中数据处理需要用到numpy、pandas等框架,算法部分可借助scikit-learning或tensorflow实现相关的机器学习或深度学习算法,相关书籍可参考《利用python进行数据分析》、西瓜书、《tensorflow技术解析与实战》
有不少。毕竟python是一种常用的语言,从业者众多,面向初学者的书籍也就不少。事实上,现在想要在家自学python也不是件难以做到的事情,只要找到合适的学习顺序就可以。
以阅读来学习python,建议选择这样几本书。
一,《笨办法学python》。这本书提供了52个例子,涵盖简单的python语法和功能,能够让读者初步掌握python。只要严格按照这本书中的要求,逐步输入代码、检查、完成课后习题,就能对python产生一个基本了解。这本书在网上能找到免费PDF版本,最新版本是第三版。另有面向python 3的版本。
二,《简明python教程》。这本书原名为《A Byte of Python》,2005年出版了第一版,被誉为最出色的python教程。在过去的十几年中,这本书一直不断改进,现在已经出到了第四版,使用python 3.5。这是一本自由图书,任何人都可以免费访问和分享。在gitbook上有译本,也可以免费下载PDF版本。
三,《Python编程:从入门到实践》。这是一本商业图书,可以在各大电商网站上购买。目前最新版本也是面向python3的。
仔细阅读这几本书,按部就班地完成案例和课后习题,就可以基本掌握python的基础知识。至于更多内容,则需要在解决问题的时候去查帮助、查python语言参考、去网上搜索解决方案,或者寻找其他书籍的帮助了。