简单定义为:数据科学是从数据中提取有用知识的一系列技能和技术。
这些技能通常用德鲁·康威(DrewConway)创造的维恩图(或它的变体)来表示:
三个圆圈分别代表三个不同的领域:编程领域(语言知识、语言库、设计模式、体系结构等);数学(代数、微积分等)和统计学领域;数据领域(特定领域的知识:医疗、金融、工业等)。
这些领域共同构成了定义中的技能和技术。它们包括获取数据、数据清理、数据分析、创建假设、算法、机器学习、优化、结果可视化等等。
数据科学汇集了这些领域和技能,支持和改进了从原始数据中提取见解和知识的过程。
什么是“有用的知识”?就是可以具有某种价值、可以回答或解决现实世界中问题的知识。
数据科学也可以定义为:研究应用数据处理和分析方面的进展,为大家提供解决方法和答案的领域。
留言点赞关注
大家一起分享AI学习与发展的干货
全平台AI垂类自媒体“读芯术”