SOFA移动性报告:构建类似苹果和谷歌的移动性分析

2020-07-24 12:19:06

根据我们的政策,任何人都可以在媒体上发表文章,但我们不会对每一篇报道进行事实核查。有关冠状病毒的更多信息,请参见cdc.gov。

我该留下来还是该走?或者如何构建类似于坐在沙发上的苹果(Apple)和谷歌(Google)的移动性分析。

三个月前,在隔离最活跃的阶段,我和我的同事亚历克斯坐在沙发上,在不同的城市保持可接受的社交距离。我们想知道是否有一种简单的方法来了解哪些地方是“安全的”,哪些由于大流行而太拥挤而不能去。在路上遇到较少人的时间是几点,走哪条路线?

这甚至导致了一项服务的原型,它可以像从谷歌(Google)收集流行时间一样收集数据(开发人员不能使用),并显示拥挤和不太拥挤的地方的热图。

由于新冠肺炎,苹果和谷歌联合起来向医疗当局提供人们移动模式如何变化的统计数据,这已经不是什么秘密了。苹果的报告反映了基于苹果地图问路的步行、驾车和交通方式的变化,而谷歌则专注于“不同类别的地点,如零售和娱乐、杂货和药店、公园、中转站、工作场所和住宅,随着时间的推移,移动趋势按地理分布”。

这两个来源都反映了与基线相比,人们开始减少(或增加)通勤、步行、驾车和参观地点的百分比-大流行前的平均水平。这些可公开获得的数据是对好奇的人的发现,也是需要做出明智决定的当局的资源。

回过头来看原型,我们细心的用户假装住在伦敦的梅菲尔区。伦敦成为测试原型的首选城市也是有原因的。它有很多公开可用的实时闭路电视摄像头。你可以通过伦敦交通摄像头网站访问近900个摄像头。它还具有每5分钟捕获一次并存储一个半月的快照归档。

我们假设,如果我们分析数据流并计算快照上的人数(实时处理对于沙发报告来说太繁重),它可能会为我们提供一些洞察力,了解这些地方在特定时间有多受欢迎,以及整个交通是如何随着时间的变化而变化的。所以,我们从市中心拍了50个摄像头。我们的圆圈的中心是大本钟,而覆盖的区域从西边的哈罗德到东边的伦敦桥,从北边的国王十字车站到南边的巴特西公园。这是一个相当中心的区域,所以不能说是整个城市,仍然足够大,直径超过5公里。

不幸的是,当这个聪明的想法出现在我们脑海中的那一刻,可用的快照档案有点过时了,无法捕捉到3月下旬社会距离规则变得更加严格导致的移动性大幅下降。因此,我们分析了可用的时间范围:从4月16日到7月8日,将近三个月。

这个分析背后的技术是OpenCV、YOLOv3和TensorFlow--这些都是可以从货架上买到的开源库和框架。在人物检测方面,我们完全依赖于YOLO这一最先进的机器学习模型进行目标检测。

根据我们对所有50台摄像机的计算,每天的人数大约在5000到29000人之间。虚线是趋势线--我们每天跳跃数字的线性近似值。正如您可能注意到的,有几个日期丢失了数据,这些是我们这边的一些技术问题,或者只是归档中丢失的天数。

我们得到的数字有多合理?嗯,当我们回想起我们每5分钟只处理一次快照时,或多或少是这样的。这是每小时12张图像。在现实中,人们更频繁地出现在相机前,所以理想情况下,我们大约每20-30秒拍摄一张照片,这将使我们每小时拍摄120-180张照片,是我们的10-15倍。乘以我们的人数,我们会在空天得到50,000-75,000人,在大流行时期在拥挤的一天得到29,000-435,000人。考虑到有限的摄像机视野,在伦敦市中心绕5公里似乎是合法的。

苹果允许下载原始数据集,这样你就可以与基准数据进行比较,基准数据是y轴的100%(而且它们也缺少几天时间)。图表上33%的数值意味着67%的伦敦人步行更少。

虽然苹果的报告描述了整个伦敦,但相机分析只观察到伦敦市中心的一部分,那里主要是办公室和公共空间,住宅楼较少。因此,我们的假设是,当居住在卧室社区的人们继续步行前往杂货店,公园和其他场所时,市中心的交通应该在隔离期间大幅减少。

从我们可以看到的是,对于市中心来说,增长的趋势是更具侵略性的。由于最初的强劲下跌,更快的增长是我们应该期待的。随着时间的推移,限制变得越来越弱,越来越多的人回到正常生活,参观位于市中心的地方。

如果我们仔细观察6月和7月,我们会看到,尽管实际数字波动,但市中心和大伦敦的趋势(虚线)几乎是相同的。这可能意味着,市中心和城市其他地方的步行模式正在以大致相同的速度恢复正常。

作为这份SOFA报告的结论,我想声明,仅仅因为缺乏视频监控,我们的方法肯定不适用于更大的地区。然而,对于配备摄像头的当地社区来说,这与苹果和谷歌等巨头的结果相当接近。