为什么癌症发病率上升竟可能是一件好事?为什么得分最多的运动员不一定是好运动员?为什么花更少的钱买更偏远的房子不一定划算?在这个数据时代,人们总是测量错误的数据,而忽视重要的指标设定。《为什么数据会说谎》解释了,“说谎”的也许不是数据本身,而是被不科学的尊龙人生就是博d88衡量指标支配的人。
?
《为什么数据会说谎》,【加】彼得 施莱弗斯著,张羿译,中信出版集团2023年6月出版,定价:79元。
数字革命在世界上掀起了一股数据浪潮,计算机不仅成倍地提高了计算能力,还提高了搜集、存储和共享信息的能力。同时,数据的爆炸式增长导致社会对衡量指标的使用激增。有了更多的信息,就可以跟踪更多的措施,实现更多的目标,进行更多的评估。
然而,作者在书中指出,其实,数字革命造成了一种信息狂妄。信息如此丰富也有不利的一面,人们可能会被自认为对自己有帮助的衡量指标引入歧途。
比如,误解人们对衡量指标的反应;关注我们投入的东西,而不是我们得到的东西;优先考虑短期收益,而不是长期收益;误用分母;只抓住整体的一部分;不限定我们的测量方法,只关注可以测量的东西;或者干脆认识不到我们无法总是去测量真正重要的东西。
因此,这本书所回答的问题并不是“我们如何分析或评估不同的数据”,而是“我们衡量的东西如何影响我们的行为和行为方式”“我们衡量事物的方式如何改变我们思考和行动的方式,如何改变我们的价值观,以及最终的成就”……这是探讨数据科学时常常被忽略的一些问题。
此外,作者还尝试对衡量指标中最常见的错误进行分类、描述,并提供解决方案。比如,人们可以学会在生活中选择更好的地图,或者减少对那些并不完美的地图的依赖;学会识别衡量指标如何以及为什么会误导人,这样就不会落入它们设置的陷阱;可以通过效仿他人树立的榜样,学会改进生活中使用的衡量指标;还可以停止不断地测量自己,学会关注那些无法用数据测量但对我们而言更重要的事情……
并非所有重要的东西都计算得清楚,也并非所有计算得清楚的东西都重要。被各种量化指标裹挟的人,要时常想一想:这些指标真的能起到衡量作用吗?