它的特质有这么4个V(volume、variety、value、velocity)。
Volume巨量
例如说,人类生产的所有印刷材料数据量大概260PB(1PB=210TB),而古往今来人类说过的话数据量大约是5EB(1EB=210PB)。拿PC的计算机硬盘来看,容量是TB量级,而某些企业的数据量已经接近EB。
Variety数据类型繁多
一般分为结构化数据与非结构化数据,也就是sql与nosql。相对于以前的结构化数据(便于储存与处理),如今非结构化数据越来越普遍,如音频,图片,日志,地理位置信息等等,对从业者的要求不断提高。
Value价值密度低
价值密度的高低与数据量大小成反比,拿视频来说,一个1小时左右的视频,在连续不断的监控中,有用数据可能仅有1到2秒。那么如何通过算法把更多有用的信息“提纯”出来,让有用的数据变为1分钟或更多呢?这是一个大数据技能中要去解决的
Velocity速度快
这是大数据区别于传统数据处理的明显特征。也是最重要的特征,因为在未来,处理数据的效率就是企业生存的根本。
偶是一哥,一个专注于大数据开发的工程师,
对大数据的学习,或工作有问题也能咨询偶。
喜欢偶的文章就关注偶吧。谢谢!