数据分析开篇三个核心:More、Messy、Correlation

2016-08-30

Viktor Mayer-Schönberger在《 大数据 时代》(Big Data: A Revolution That Will Transform How We Live, Work, and Think)一书中提出了关于大数据的 3 个特征(原则):1: more, 2: messy, 3: correlation. 在中译本中被详细的阐释为“不是随机样本而是全体数据”;“不是精确性,而是混杂性”;“不是因果关系而是相关关系”。这 3 个原则引起了相对大的质疑与争议。本文无意去讨论这几个原则的是是非非,但我们认为这三个特征很好地概括了相当一部分数据科学话题所处理数据的特征。因而本文以这三个特征为文眼,引出我们对公开的初创企业投融资数据的第一批分析结果。

来源: