我坐过的每一辆出租车都在抱怨当司机入不敷出有多难。公众通常很快就会指责来自优步(Uber)等公司的不公平竞争。然而,额外的力量也是罪魁祸首。
通过10多年的纽约市出租车数据,我通过与股票期权交易进行类比,分析了陈旧的计程表系统是如何影响纽约市出租车司机的生计的。有趣的是,这种方法让我们可以表明,司机们的境况已经逐渐变差,独立于来自优步的竞争。
为此,我们将一个数据集加载到我们的数据库QuestDB中。该数据集包括超过16亿次出租车乘车次数,7亿次FHV乘车次数(Uber,Lyft等),以及10年来的天气和汽油价格数据。
几个月前,我正在为我们在ShowHN上分享的QuestDB的演示整理数据。
我离开衍生品交易已经有一段时间了,没想到最后会写关于期权定价的文章。令我惊讶的是,ATAXI计价器的经济性与期权非常相似。这为出租车司机的命运提供了一个有趣的视角。
大多数游乐设施都是使用标准计价器计价的。计价器是一种机器,它根据输入的信息(如时间、速度和距离)计算游乐设施的价格。此外,它还根据各种因素(如所走的路线或一天中的时间)增加税收、通行费和附加费。
司机的大部分收入来自车费,其中包括进入出租车的固定车费2.50美元和可变车费。可变距离是速度、时间和距离的函数。计算方法如下:
这篇文章的重点是可变票价,也就是说,计价器的输出不包括2.50美元的起步费和额外费用。为了能够相互比较乘车次数,我们将其正常化为每小时载客户出行的费率。
让我们假设一辆出租车在一个小时内以恒定的速度载着一位顾客。在一小时结束时,司机可以预期获得以下可变收入:
让我们画出时薪与速度的函数关系图。这立刻让我想起了一位老朋友:看涨期权!
有保证的部分30:无论何时开车,出租车每小时至少能赚30美元。
这种制度是有原因的。它旨在协调司机和乘客的利益:
有保证的部分使骑车人不愿让司机等待,并确保他们的时间是有报酬的。
让我们尝试用期权定价方法来量化可选部分的价值,以便研究对司机的激励。
这篇文章并不是金融数学的一篇论文(远非如此),但在我们继续之前,了解是什么让选择有价值是很有用的。购买期权就像是付钱玩一场游戏,货币支付取决于某个变量。
举个例子,想一想骰子游戏。如果骰值(我们的变量)小于2,您将收到0。否则,您将得到该值与2之间的差值。在金融市场中,阈值2称为执行价,表示为K。
玩这个游戏需要付费。您准备付多少钱?
为了找出答案,我们需要计算游戏的期望值。这很容易,因为我们知道所有可能的结果及其各自发生的概率。我们可以将这些内容写在下表中:
通过将所有按概率加权的潜在支出相加,我们计算出玩这个游戏的期望值:1.4494美元。
这个例子表明,在最简单的形式下,期权的价值等于期权到期时支付概况和相关概率分布的乘积。让我们通过在下图中绘制OurGame的值来可视化这一点:
青色虚线是每个结果(骰子值)发生的概率。这是一条16.66%的直线,因为这6个值中的每一个都是等概率的。
彩色区域是前两条线的乘积。它的总表面就是我们期权的价值。
当然,这是非常简单的。我省略了时间价值,这是你(几乎)总是希望你能保持更长时间的选择的想法。TimeValue存在的原因与不对称的回报概况有关:等待时间长一点会带来更多的收益,而不是损失。而且,在现实生活中,结果几乎是不可能的。例如,股票价格表示为对数正态分布。然而,这个例子很好地介绍了如何计算期权的价值。
现在,既然我们看到速度是可变票价背后的主要驱动力,我们应该尝试建立一个速度分布的表示法来估计期权价值。
这可以使用对数正态分布来实现,该分布类似于正态分布,但不能为负。这很适合我们的情况,因为卡巴车只能开到每小时0英里以上。
标准偏差是衡量达到的速度可能偏离平均值的一个量度。
如果我们将对数正态分布叠加到期权收益上,我们可以看到下面的期权价值是两个表面积的乘积。如你所见,对数正态分布向左倾斜,模式(分布的最高点,约为每小时10英里)低于平均值(上图为每小时13英里)。
我们可以使用我们的两个参数来掌握定价动态。以下是平均速度如何改变分布和期望值:
我们可以看到,均值越高,标准差越大,期权价值越高。简而言之,这意味着司机最大的利益在于。
现在,我要澄清的是,我并不是说他们应该鲁莽驾驶,而是说他们应该尝试冒险的路线,这要么会节省很多时间,要么就会是一场灾难。
在传统金融学中,我们在上面介绍的对输入参数的敏感性被称为“希腊人”。这些是(主要)以希腊字母命名的风险衡量标准。它们用于评估和管理期权投资组合的风险。以下是关于平均值和标准偏差的两个希腊数字:
这些是希腊人的第一订单,这意味着他们直接影响期权价值。有更多的希腊人,地位更高,这间接影响了期权的价值。例如,Vanna是一个二阶希腊人,它衡量当波动率变化时期权的增量(一阶希腊人)变化有多大。
纽约市出租车数据集给出了计价器计算的距离、接送时间戳和下车时间戳。使用QuestDB,我们可以将每次骑行的持续时间导出为两个时间戳之间的差值,然后将距离除以持续时间,以计算平均速度。
使用Sample By,我计算每月间隔和下面的曲线图的平均结果。在过去的10年里,平均时速从13.3英里显著下降到了9.7英里/小时(几乎30%!)。
这个数字是一个简化,因为它假设速度是恒定的,没有空闲时间。但是,按如下方式计算收益下限是有用的。
同样,我们可以在一个理论世界中估计司机每小时收入的上限,在这个理论世界中,司机要么空闲,要么瞬间加速,从0加速到25英里每小时的限速。最高潜在票价的计算方法如下:
以下是这三个指标随时间的变化情况(请注意,自2012年8月出租车价格上调以来,我们于2012年9月开始了这一计划。有趣的是,平均最低可变票价随着时间的推移而下降,现在正在浮出水面。
现在我们有了平均速度,我们可以使用标准偏差来模拟速度分布。通过将历史平均值和标准差输入对数正态分布模型,我们可以计算出以下百分比。对于绝大多数乘车,司机预计平均时速低于12英里。
综上所述,下面的图表显示了经济是如何随着时间的推移而变化的,我们可以看到这是如何损害司机的期权价值的,主要是因为趋势均值较低。
我们现在可以使用我们的数据从票价中提取实际期权价值,如下所示。
慢慢地,但肯定的是,它不再是司机收入的重要组成部分。
我没有数据来解释为什么平均速度较低,但我会直接将其归因于优步、Lyft和其他FHV导致的道路上更多的车辆,以及城市规划,例如为减少道路空间和更多的拥堵而修建的自行车道。
无论潜在的原因是什么,其影响都是显而易见的,而且是显著的。在过去的10年里,交通放缓的成本高达每辆出租车10美元/小时。与此相比,这意味着每个司机每年花费29,000美元(每天8小时,没有假期),或者整个纽约市出租车行业每年花费3亿美元!这些是下限数字。在现实中,司机是共乘出租车的。如果我们假设所有13,500辆出租车都经常在路上行驶,那么该行业每年的损失就会达到12亿美元!
收费系统的设计是为了激励司机和骑车人公平竞争,这些激励措施今天几乎消失了,这使得计价器系统产生了适得其反的效果。
10年前,当司机的平均时速是13英里时,他们现在的预期速度是9英里/小时左右,远远低于12英里/小时的门槛。如果我们按照下面的方式来看,随着时间的推移,创新的损失就会变得很明显:
2.50美元的起步费提供了另一种激励。但它的功效取决于两次骑行之间的等待时间。如果顾客之间的预期等待时间不超过5分钟,那么司机仍然会受到激励。否则,开慢点,最大限度地利用现有客户,在经济上会更有效率。赚得少的出租车比空的要赚更多的钱。
我没有数据来估计司机在两次乘车之间的等待时间,但在一个供应和竞争(Uber、Lyft等)不断增加的世界里,我认为可以放心地假设司机的等待时间增加了。因此,虽然我不能确定起步费是否已经失去了所有的动力,但似乎可以公平地说,它失去了很大一部分动力。
如果司机不确定是否有可能找到下一辆车,如果可选的车费部分已经成为他们车费中微不足道的一部分,那么更有意义的是减速行驶,并尽可能长时间地留住目前的客户。最后,每小时30美元总比0好。
我们在线提供了此数据集和数据库,您可以通过QuestDB演示从浏览器直接查询它。
请随时探索它,提出更多的分析,并让我知道您的发现。
我对根据天气数据扩展这些结果特别感兴趣。Ilet读者可以使用QuestDB演示服务器上提供的每小时数据来尝试一下。在他的分析中,托德·W·施耐德(Todd W Schneider)得出结论,降雨对骑行次数没有显著影响。但是票价呢?难道不觉得下雨的时候交通变慢了吗?这将是一个有趣的研究天气如何影响拖拉机的速度,并反过来收益。这只是这个数据集中有待探索的众多问题中的一个。
不管怎样,我希望你会觉得这很有趣。如果你喜欢这篇帖子,请考虑在我们的GitHub上留下一颗星。如果你在玩数据的时候发现了什么有趣的事情,给我发电子邮件,我们会写下来的!