通过大数据,谷歌能够比医院更早知道流感即将爆发,因为人们在去医院之前,总是喜欢现在网络上查询流感的特征。当流感相关的query查询量增加的时候,基本就可以预知,新一轮流感即将到来。
概率论有一个定律叫做“大数定律”,是说在随机事件大量的重复中,往往呈现几乎确定存在的规律,这个规律就是大数定律。通俗的说,只要数据量足够大,偶然中就包含着某种必然。
可以说,现在大数据基本上渗透到大家生活的每个角落。
软件开发者在大数据领域要做的首先是存储这些数据,既然是海量数据,如何稳定的存储与高效的读取,是开发者面临的第一个问题。在偶之前的回答中偶曾经提到,当数据量非常大的时候,MySql就算使用索引,也无法快速的响应复杂查询了。因此,大数据的存储通常抛弃MySQL,而改用ElasticSearch,这是一种在处理大数据查询时有优异表现的产品。
只做存储就失去了大数据的初衷。基于海量数据,分析出某种规律,从而预知某些事情,才是大数据的精妙之处。举例支付宝,一直觊觎腾讯霸占的社交领域,在电商领域独大的它为何非要强推社交软件呢?因为电商再强大,人们也不是天天要用(剁手党除外),而社交是人们每天都离不开的需求,每天产生的数据不可估量,如果能够从中分得一块蛋糕,将会帮助支付宝分析出的更多更准确的用户画像,从而协助制定后续更有针对性的发展规划。
因此,大数据的重要性不言而喻。
以上是偶对大数据领域开发者的工作的分析,如果你有任何见解,欢迎在下方评论留言。
偶是苏苏思量,来自BAT的java开发工程师,每天分享科技类见闻,欢迎关注偶,与偶共同进步。