另类数据

当我们要分析一个企业的经营情况时,往往会收集跟经营相关的数据,比如企业的进出口量,原材料采购信息等。但有时这些信息并不能反应真实的情况,比如一个皮包公司,进出口数据,采购数据都可以伪报,虚报,所以很难发现真正的问题。这时候,就要从另一个维度来收集数据,比如企业的用电量。这个数据是电力公司统一统计的,企业很难造假。企业的用电量和实际的生产规模不匹配,那肯定有问题。 今天,逻辑思维也谈到了这一现象,他称这类数据为“另类数据”,比如想了解特斯拉公司最近是否要发布新品了,可以通过电信公司查看晚上公司的手机在线数量来判断最近是否有大量的加班,如果近期突然有密集加班的情况出现,发布新品的概率比较大。 其实,我倒觉得,叫“另类”数据也不太适合,给人一种剑走偏锋的感觉。通过不同维度的数据来分析,本来就是大数据分析的一种方法。叫“全面数据分析”可能更合理点。事物本来就是多角度呈现的,我们人为的选取了一个角度去观察,并得出结论,其实并不客观。在大数据分析时代,并没有什么所谓的“另类”数据,只有不同维度的数据。把不同维度的数据整合起来,那才是一个客观的展现。

Written on June 17, 2019