在此之后,才可以说进行关联分析。关联分析(规则)即挖掘关联现象,从大量数据当中发现事物、特征或者数据之间的,频繁出现的相互依赖关系和关联关系。关联关系包含简单关联、时序关联及因果关联等,这些关联有的产生于经验之中,但并不总是事先知道,而是通过数据库中数据的关联分析获得的,其对商业决策具有重要的价值,常用于实体商店或电商的跨品类推荐,购物车联合营销,货架布局陈列,联合促销,市场营销等,来达到关联项互相销量提升与共赢,提升用户体验,减少上货员与用户投入时间,寻找高潜用户。
怎样快速地把数据拿来做一个整合,又很快地呈现出来,是非常重要的。数据分析挖掘很重要,但有时一些应用场景和分析挖掘不一定有太大关系。举个例子,假设某地发生了一个大地震,在这个灾难性事件中,最重要的不是预测,而是诊断,让你了解现在的情况是什么,未来要朝哪个方向走。这就需要数据的整合与呈现。分析的力量是你能够对整个流程进行分析,而不是某个环节。你可以看到真正的故事在于快速关联不同的数据源。
过去大家谈大数据分析包含了数据采集、清洗、分析和展现,今天谈的好像是关联、分析和展现,那么是不是大数据分析的理念变了呢?的确是一个比较大的概念上的转换。从信息的角度看,每个数据都有价值,获得的数据越多越好,有些系统通过清洗或是数据处理,可能把一些价值去除掉了。另外,过去是ETL,也就是数据抽取、转换和上载。现在所谓的转换,是在关联引擎里面做的。数据抽取出来,然后上传,再做转换,也就是ELT。ELT对比ETL,速度要快很多。