在OpenStreetMap中有关付费编辑的2021更新

2021-04-04 07:29:09

最近关于OSM中已付费编辑的文章和博客帖子已更新对社交媒体和OSM讨论渠道的主题的兴趣。这些讨论中提出的数据和数字主要来自我在2019年共同撰写的文件中,现在已经过时了。这个日记帖子呈现出新的,更新的数据。

在过去几个月内,OSM中的报酬编辑正在接受新的两个文章,这些文章正在报告现象。这篇文章从我们2019年企业编辑中的两种文章在OpenStreetMap纸的不断变化的景观中重新引用了数字:

这些文章促使较大的OSM社区的Twitter讨论。然而,这些后续线程中缺少的是关于过去两年的编辑的更新数据。

此帖子仅介绍了与OSM和观察分析中的有关编辑相关的更新数据。随着OSM研究社区继续扩展,在这个空间中保持更深入的研究,例如:识别未公开的报酬和职业映射者,从编辑编辑模式的新社区检测算法以及进一步调查的新方法付费和未缴款的编辑器之间的映射交互。此日记帖的结尾我包含了一个词汇表,其中一些术语和以前的矿井帖子,如付费编辑,专业编辑和职业编辑。这些术语在这项研究空间中变得越来越常见,因此我希望能更好地介绍并定义它们。

与2019的方法不同,我只使用来自OSM Chinessets的数据。仅使用变形集的主要优点是它大大降低了数据量(与所有OSM相对的100m记录)。此外,在计算映射器的数量时,Changeets是一个准确的分析单元,因为它们只有一个作者。但是,在工作的数量时,变频器都有各种形状和尺寸。每个Chanceset中的NUM_CHANGES字段表示OSM数据库中修改的行的总行数,这为我们提供了精确的更改数,但这很少与编辑的地图对象的数量完全相关联。例如,新的矩形建筑为5个变化:4个节点+ 1路。如果它是一个直线段,或者,如果它与许多节点绕组,则新的道路可能是3个变化。这就是说这些值充当编辑活动量的良好代理,尤其是在相对比较时但是,当报告的情况下,其中一些值失去了意义:“1M编辑/更改”和“200k新建建筑物”是非常不同的数字,但根据Changeset记录中的Num_changes字段,它们是相同的。

此前,我一直在监视OSM Wiki和各种GitHub页面上的所有数据团队列表,以维护与不同的团队相关的2,000多个用户名列表。然而,有组织编辑指南的光明,公司拥有最佳实践在他们的团队中,并通过员工在其OSM用户页面上披露其关联,大大简化了此跟踪过程。一些像Apple和Kaart这样的公司甚至可以为他们的所有变频器添加特定的HASHTAG,这可以使这一过程变得更轻松。所以,我如何识别今天付费编辑?我看一下OSM用户页面并搜索特定的声明,如:“我为亚马逊物流工作”或“我正在为苹果的一些项目工作”尽管没有完美召回付费编辑器,我发现它真的很好地工作,识别95%的编辑我以前手动跟踪。

我使用这个团队列表来识别大型付费编辑团队。这篇文章包括比我们2019纸的更多球队,而不是出席:

图1.基于帐户加入日期随着时间的推移编辑的数量。注意〜600映射器在其个人资料中有“以前”或“无效”。它们不包括在这里。

图2:每个月有多少付费映射器?完整计数位于顶部,而底部图形只计算在任何国家/地区制作超过5个变更集的映射器。这是一个更好的映射活动指标。

具有付费编辑活动的前50个国家在下面的数据中排名从大部分到最小的y轴上的。请注意,X轴上所示的总编辑是指Cranneet记录中Num_changes字段的总和。

图3:每个国家/地区OSM中的付费/未付款编辑的细分。左图(2015 - 2018)包含2019纸上报告的值。右边的数据是自2019年1月以来的新编辑活动。

图4:每一个前50个最具报酬的国家/地区每月支付的总编辑的百分比。每行按0到100%缩放,其中蓝色区域表示来自付费映射器的总编辑的百分比。橙色区域代表绝对的编辑次数,始终如一地缩放所有行。例如,博茨瓦纳(来自底部的第五行)从2018年后期(高大的蓝色区域)看到了大部分来自付费编辑器(高大的蓝色区域),但橙色整体的绝对数量非常低(非常小的橙色区域)。

图5:每个国家的有偿编辑的每组崩溃。左侧显示了自2015年以来的每个国家/地区的绝对编辑计数。右侧左侧缩小左侧的橙色部分,显示哪些公司负责映射。

最值得注意的是,亚马逊物流团队在美国正在做的大量编辑。印度尼西亚已从苹果,抓斗和Facebook看到了很多映射。然而,总的来说,自2015年以来,这仍然不到印度尼西亚所有编辑的20%。请评论您可能会注意到值得调查的任何其他模式!

图6:过去5年中每个国家的付费编辑百分比的变化。随着不同的团队在世界各地工作,他们对各国的兴趣发生了变化。这些地图显示了每个国家之间的报酬编辑的总体百分比如何变化。我使用百分比来显示相对映射活动,而不是原始编辑计数。

总体而言,自2019年初次报告以来,OSM中的报告编辑活动肯定会增加。当时,这是趋势正在移动的明显方向。我希望这里的数字可以将更多的上下文和数据添加到OSM中的有关编辑的较大讨论。

请留下任何意见或问题,我将尝试在后续职位回答它们。另外,请注意在该领域的更多研究。

有组织的编辑 - 一个全包术语,描述了OSM编辑活动,其中映射器与其他人协调,以确定它们如何映射。以前称为“定向编辑”,但仅简要介绍。有组织的编辑指南是OpenStreetMap基金会发布的正式指导方针,但他们不是官方可执行的政策。不遵守指南被认为是糟糕的映射实践,但并不是唯一的行动理由(禁止,恢复等)

付费编辑/付费映射 - 一种组织编辑的形式,其中麦地麦正在收到他们花费编辑OSM的时间收到财务补偿。该活动被认为是有组织的,因为编辑不是他们自己的意志映射,而是在他们的雇主的詹姆斯。任何未进行报酬编辑的人被视为未付款的编辑器/映射器。

付费编辑/映射团队 - 一组在其映射活动中协调的一组有偿编辑,为同一组织工作。

企业编辑/映射 - 当公司直接由公司直接雇用的付费编辑团队,例如苹果,亚马逊,抓斗,微软,Facebook或其他人雇用的数十几个映射者。

人道主义编辑/映射 - 当地图以一种方式编辑为人道主义危机救济努力或支持人道主义援助(包括责备,救灾等)。经常被认为是一种有组织编辑的形式,因为OSM中的大多数人道主义编辑由人道主义OSM团队(HOT)协调。

专业编辑/映射 - 当映射器具有专业化的编辑培训时。根据定义,付费映射器是专业的映射器,因为它们是作为他们职业的一部分的映射,并支付这样做。专业编辑的其他示例可能包括从与之合作的GIS专业人员映射并贡献OSM,但它们未支付也不是直接组织,使其不是组织编辑的形式。

职业编辑/映射 - 当某人“像他们的工作一样映射”时,但它们不一定直接支付以编辑地图。在工作时间在工作日期间一直映射的人可以被视为职业编辑。这包括可以作为课程分配的一部分持续映射的学生。我们可能会假设他们参与使用或编辑专业容量的OSM,使其成为专业的映射器。

Hobbyist / Hobby编辑/映射 - 用于描述不适合上述类别的映射活动的捕获活动。用于编辑的一个稍微理想的术语,它在一个人的业余时间纯粹以志愿者容量发生。

该分析是通过与Facebook的支持和协作进行的。所有分析数据来自Amazon的OSM公共数据集,对OSM用户API的调用以及来自自然地球数据的国家轮廓。

地点:最后一次机会Gulch,Helena,刘易斯和克拉克县,蒙大拿州,59601,美国