数据信息/数据干货分享/大数据资料下载关注公众号【中云大数据分析】或网站http://www.wstxjs.com/
人们对于大数据的迷恋可以理解,毕竟现实生活中,分歧很多,各有各的观点,最具说服力的往往是数据!冷冰冰的数据往往不带主观性,不偏不倚确实比主观观点什么更值得信任,这反而说明社会进步了!但是大数据一旦被夸大或者运用不当,人们错误的观点往往会加深,进一步固化!
例如多年以前,某购物网站发表了一篇关于女性胸围的大数据,通过销售的数据得出了一个结论黑龙江姑娘的胸围最小!这与大家普遍的认知产生了很大的冲突,因为大家普遍认为东北姑娘身材高挑丰满。这个数据一出来,部分坚信自己省份女性更好(但多数人不认同)的人,认为这份数据是有力的证明!
大数据与销售数据这份数据是不是符合现实,没调查偶不知道,去过的省份也少,但这份数据真的能说明问题吗?有没有另外一种完全相反的可能性——黑龙江的姑娘胸围不是最小,而是普遍很丰满,当地的商店担心小文胸不好卖而不进货,部分女性只好上购物网站购买!
再举一个例子,购物网站数据证明,40岁以上的高消费男性更爱拥有事业线的女性,价格在百元左右,而“屌丝男”则对“事业线”没太多需求,仅对豹纹款的内衣表现出偏爱,其消费区间在30-50元之间。这种数据证明没有什么说服力,从人性的角度来讲,难道40以下的男性不偏爱拥有事业线的女性?“屌丝男”需求也得建立在女友的基础上(总不至于买个文胸自己用吧?),很可能是因为拥有事业线的女性更偏爱选择高消费男性!
诚然大数据在数据记录方面,数据异常对比有着无比巨大的优势,例如打击刷单等行为!但把大数据等同于科学,迷信它得出的结论是一种很严重的错误,它没有人们想象中的那么靠谱!
很多商业公司都追求数字化转型,纷纷想把大数据引用到自己的商业活动中,但国外研究机构Gartner通过调查发现60%的大数据项目是失败。而Gartner分析师尼克·海德克(NickHeudecker)表示,实际数字现在已接近85%,因为人们还是“过于保守”!
关于大数据失败的例子最典型的就是google的流感预测了,而偶相信若不是刚开始2008年预测的“成功”,google根本不会大肆宣传自己的大数据,后来几年的预测表现实在是打脸!毕竟没有哪家公司愿意主动告诉人们他们失败的项目,他们更愿意用成功的,富有故事性的成功案例来宣传自己,即使告诉了媒体也觉得没什么报道价值,他们更热衷于报道新事物的神奇!
自媒体运营的人对各大平台的推荐效果感触应该很深!虽然各大自媒体平台都宣称采用大数据智能化推荐,但是实际上效果差距甚远,一模一样的文章基本同时在不同平台发表(不去运作的情况下),你会发现差距很大,有的没什么推荐没什么阅读,有的不温不火,有的平台迅速热起来了,收藏转发评论的很多,阅读量很快就起来了,也许下一篇文章,你发现跟原来的又不一样了,完全偏向随机性的,离智能还是比较远!
为什么说大数据不是科学?
目前大数据的应用还是在众多的数据中分析得出结论,这很像科学刚开始的样子,但却缺少科学最重要的验证过程!大样本随机双盲分组对照实验已经科学验证标准范式了!在单一条件不同的情况下,需要人工设置其余条件完全一模一样,从而通过对比来观察单一因素对实验结果的影响!可是一到社会活动中,各种变量就复杂多了,大数据往往来自于各种各样复杂的社会条件下的产物,而社会又在不断地变动中,如何做到其他条件不变?结果是什么条件导致的,是单一的条件还是很多原因共同导致的?
例如大数据最有名的例子就是啤酒和尿布的故事,沃尔玛通过销售数据发现在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,随后调整商品分布将尿布和啤酒放置在同一片区域,从而提高了销售收入!沃尔玛给出的原因是婴儿的母亲一般在家带孩子,孩子父亲负责购物,所以帮孩子购买尿布的同时也会顺便给自己买啤酒!
你不觉得奇怪吗?如果这种发现真的有用,那么其他商店就会学习跟进,然而现在大家能看到几家超市是将尿布和啤酒放在一起的,就连沃尔玛自己现在也不这么干!难道现在是带婴儿的都是男性了?沃尔玛给出的原因根本没有什么变化!什么条件导致这样的现象无从验证,也许是当时啤酒正在促销,也许统计数据的时候刚好遇上了啤酒销售旺季,或许当地刚好有什么狂欢节日,导致啤酒需求量上升,又或者那段时间天气实在是太热了,说不定当时刚好赶上什么重要的赛事,比如说世界杯等等,现实生活中就是有这么多因素,不管其中的一种或者几种很多种都可能导致啤酒需求量上升!天气,赛事这种偶然性的因素很难重现,又或者这几种条件很那重现共同出现,你如何去控制所有条件,改变单一因素?
大数据作用很大,能给大家带来很多好处,但它不是万能的,也存在很多局限性,一旦迷信大数据不做认真的分析和判断,往往可能把这种偶然的现象当成规律来处理,这个时候你会投入大量的资源来配置,教训也就随之而来了!