阶段一、大数据基础——java语言基础方面
(1)Java语言基础
Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射、多线程、Swing程序与集合类
(2)JavaWeb和数据库
数据库、JavaWeb开发核心、JavaWeb开发内幕
推荐书籍:
《Effective Java中文版》(第2版)
这本书是学习java必备书籍,看完这本书也就掌握了入门的基础知识。
阶段二、 Linux&Hadoop生态体系
学习大数据离不开hadoop,围绕hadoop有一套生态体系,分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架需要了解并掌握。
推荐书籍:
1、《Big Data》
2、《Hadoop权威指南》
3、《Hive编程指南》
阶段三、 分布式计算。
(1)分布式计算框架
Python编程语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算等
(2)storm技术架构体系
Storm原理与基础、消息队列kafka、Redis工具、zookeeper集群
推荐书籍:
1、《Learning Spark》
2、《Spark机器学习:核心技术与实践》
阶段四、机器学习和深度学习算法的学习,可以更好的利用大数据去处理问题。
mysql学习视频,根据时间对比mysql,mysql.exe启动,mysql没有索引间隙锁,mysql 报表 远程,mysql 增加用户名