而数据挖掘主要不是查询,而是做更多的计算,例如分类,回归是拟合计算,找到标签与其他特征的规律,形成模型,数据挖掘算法会有很多迭代计算,比OLAP的计算要复杂很多,另外,数据挖掘做的更多的是探索式的分析,分析前是没有假设的.所以数据挖掘往往能发现一些人为经验忽略的因素。
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
广义的数据分析,应当是包含数据挖掘和统计的。数据挖掘是面对海量数据时的有效工具,而数据统计是为分析过程提供可靠模型和结果检验的有效工具。这两个工具可以用在数据分析中,但不只用在数据分析中。数据分析就是数据到有效信息的过程。
数据统计。专注于建模及统计分析,通过概率、统计、离散等数学知识建立合理模型,充分发掘数据内容。例如用回归分析,充分利用网站历史数据,进行评估、预测、反向预测、发掘因素。利用贝叶斯方法建立模型来进行机器学习、聚类、垃圾邮件过滤等。常用工具如:SAS,R,SPSS。