如果想从事数据分析/数据挖掘/机器学习,首先你需要一门编程语言,如Python或者R。
在分析挖掘过程中,需要建立模型,优化模型参数,需要了解概率论、统计学、线性代数的相关知识。
Python或者R需要搭建在一个系统上,如Linux,甚至需要自己编译一些框架,如:opencv,mxnet
当数据量大了过后,你需要采用分布式环境来存储和计算,此时需要Hadoop或者Spark。
如果是做深度学习,那么你还需要配置一个Linux下的GPU环境。
在业务中,你还需要深入理解业务,方能更好的去建立模型。
在理解业务过程中,你还需要与各种人打交道,以便了解客户的核心需求。
总之,进:能了解客户需求,出方案,中间还能带团队。退:还能搭环境,写代码,建模型,调参数。
对纯技术的了解,可以参考偶的书《全栈数据之门》和文章『全栈数据主要技术点』。