跳到主要内容
在中国大数据产业博览会上亮起屏幕
社会流动备忘录

对异构的希望:大数据,机遇和政策

“大数据”对于证明大型群体之间的差异特别有用。举例来说,斯坦福大学的经济学家拉吉·切蒂(Raj Chetty)和他的同事们使用行政税收数据显示,按地理位置,按不同学院的学生的经济背景,按不同老师授课的学生的收入等等,向上迁移率存在很大差异。

这里的基本信息是,在理解如何增加机会方面,一概而论是危险的。对于任何给定的国家趋势或情况,都会有地方,人民或机构的表现比平均水平差得多,而很多地方,人民或机构的情况要好得多。

几周前,拉吉·切蒂(Raj Chetty)被布鲁金斯(Brookings)停下来介绍他的最新研究。演讲结束后,他与我和Adrianna Pita一起参加了Intersections播客,讨论大数据如何帮助我们理解人群中的多样性,或者像学者所说的那样:帮助我们证明异质性。

您可以 在这里收听播客。如果您错过了切蒂的演讲,可以 观看活动视频.

当然,Chetty并不是唯一处理大型数据集的人。斯坦福大学的肖恩·瑞登(Sean Reardon)为全国各地的学童在不同的时间点收集了庞大的测试成绩结果数据集。 Reardon在11,000多个学区拥有3亿个考试分数,例如,看3年级和8年级的成绩。正如您所希望的那样,3年级分数较低的学区更有可能属于低收入人群地区,并且八年级的分数也较低

然而,就政策而言,更有趣的是与这个故事的背离。下图显示了100个最大的学区在3年级的成就以及3年级和8年级之间的成就增长中所处的位置(每个气泡的大小对应于该地区的人口)。右上象限中的区域,例如普莱诺独立学区,具有较高的初期成就和较高的增长;左上角的地区(如芝加哥)起初成绩不佳,但增长很快;等等。

异质性图1
Source: Reardon, S.F. (2017). TEducational opportunity in early 和 middle childhood: Variation by place 和 age (CEPA Working Paper No.17-12). Retrieved from Stanford Center for 教育 Policy Analysis: http://cepa.stanford.edu/wp17-12

按地区检查数据可以使我们看到,虽然巴尔的摩和芝加哥的三年级学生的成就水平相似,但到了八年级,芝加哥的学生已经跃居了前列。尽管基数较低,但芝加哥八年级学生的得分与纽约和亨里科县的得分大致相同。 (落在同一对角线上的区域具有相同的平均八年级成绩水平)。

Reardon说:“一个地区的社会经济状况是该地区学生平均考试成绩表现的有力预测指标。” “不过,贫困不是命运:有些地区的低收入学生人口的学业成绩要高于其他地区。我们可以并且应该从这些地方学习,以指导其他社区的社区和学校改善工作。”

Reardon和Chetty等大数据学者的工作有助于阐明提高低收入儿童向上移动性的挑战的规模。但是异质性也给了希望。我们可以找出在积极方向上逆转趋势的机构或城市:并从中学习到什么。大数据不仅成为描述世界,而且改变世界的工具。

获取布鲁金斯的每日更新