日间卫星图像能够比夜晚图像更好地描绘贫困状况。图片来源:lightyear105/iStockphoto
只有当你知道他们在哪里时,才能解决这个世界上的问题。例如,这也就是为什么对联合国(UN)而言,在非洲跟踪贫困至关重要——UN在2015年发起了一项在全球抵制贫困的运动。然而在地面上搜集数据往往是危险、缓慢及昂贵的。如今,一项研究利用卫星图像及机器学习给出了一个新的选择——从太空绘制贫困地图。
人造卫星上携带的高性能照相机一直在不断捕捉地球的照片,并且科学家寻思,是否可以通过分析图像来调查贫困问题。
科学家所作的第一种此类尝试依赖于夜晚拍摄的地球图像。电灯发出的灯光绘制了一个地区基础设施的发光图,粗略地显示了富人和穷人都生活在哪里。但是在晚上,适度的经济欠发达地区看起来与绝对贫困地区——依据世界银行的定义每天花销不足1.9美元的地区——并没有太大的差别。
因此由美国加利福尼亚州帕洛阿尔托市斯坦福大学经济学家Marshall Burke率领的一个社会学家和计算机科学家研究团队,对卫星日间图像进行了筛选。这些图像也仅仅显示出了绝对贫困地区和中等贫困地区之间的一些细微差别。两者都具有泥泞的、坑坑洼洼的道路,蜿蜒地延伸到一个个小村庄。但白天的图像包括了其他一些关键指标:与最近的水源或最近的城市市场有多远?农田在哪里?
从这些细微的暗示得出结论甚至超越了一名训练有素的专家的能力范畴——但可能难不倒一台计算机。
使具有多个变量的大数据集变得有意义是机器学习领域的一个经典挑战。其策略大致如下:首先得到一个目标变量是已知的数据集,在这种情况下通常为人均收入。随后,在这些数据的一个子集的基础上训练计算机,从而创建一个统计模型,能够准确预测其余数据中的隐藏变量。
Burke的研究小组使用一种被称为卷积神经网络的机器学习技术,彻底改变了机器视觉领域。研究人员专注于5个非洲国家——尼日利亚、坦桑尼亚、乌干达、马拉维和卢旺达。这些国家都有很大比例的人口生活在绝对贫困地区,并且来自地面的良好调查数据为计算机作出的任何预测提供了依据。
研究人员指出,对于绘制非洲贫困状况来说,白天的卫星图像比夜晚图像好得多。与后者相比,前者预测某一地区处于绝对贫困线以下情况的准确率为81%,并且在预测收入不足这一数字一半的某些地区时的准确率为99%。
研究人员在8月19日出版的美国《科学》杂志上报告了这一研究成果。
并未参与该项研究的纽约州帕利塞兹市哥伦比亚大学地球研究所政治学家Marc Levy表示,依然需要用地面调查来构建及验证这一工具。但他说,这项研究表明卫星图像加上地面调查“将比任何一种单独方式更为强大”,特别是在那些进行地面调查很困难甚至不可能的地区。
Levy强调,将这项技术推广到全世界其他地区也将具有重要意义。“与作为一个整体与世界其他地区相比,这5个国家彼此之间更为相似。”他说,例如,非洲是最后一个“抵抗”城市化趋势的地区——这里的大多数人依然生活在农村。“在其他城市化国家使用这项研究所涉及的技术可能要难得多,尽管它依然能够奏效。”(来源:中国科学报 赵熙熙)