个人经验,以下几方面需要了解:
1. 编程语言及工具
目前最常用的是语言是Python,C/C++,R等,至少掌握一门语言; 深度学习架构pytorch, tensorflow等,也都摸一下,这一部分主要侧重于应用层,再了解一下常用的算法,(网上有帖子形象的展示各算法大概是怎么回事,不求细节,有个概念),实现现成的算法,维护现有的机器学习平台,增加应用,修改接口等等,都没问题。
2. 算法及模型
这一层主要是遇到实际的问题,理解问题并能够选择合适的算法或模型来搭建框架,解决问题。另外,对算法原理熟悉了,有助于过程中调参和优化。
推荐周志华的《机器学习》,清华大学出版社,比较有条理。
常见的算法或模型都有,如线性模型,决策树,神经网络,贝叶斯分类,聚类分析等算法。
3. 高等数学知识
这部分知识一是第二部分的基础,也是研究机器学习算法的必备。
数值分析,线性代数,矩阵分析,优化理论等知识储备,只有掌握了这些才有可能优化现有的模型,提出新的算法模型。