走向月球:定义和检测加密货币的抽放交易(2018)

2021-01-10 13:28:48

Warning: Can only detect less than 5000 characters

Warning: Can only detect less than 5000 characters

表1指出,加密P& D看起来与便士股票P& D相似,因为具有相同属性的资产已成为目标。但是,总的来说,由于采取了不同的策略,时间尺度似乎已经缩小,并接近实时。正如通过互联网对信息进行数字化增加了便士股票上的P&D骗局的比率一样,货币数字化本身也提高了P&D发生的速度和速度。

使用已识别的加密P& D的特征,我们可以制定标准,以帮助检测交换数据中的P& D模式(表2)。具体来说,我们认为P& D的指标可以细分为突破指标,这些指标是指在泵送和卸载过程中将始终存在的信号,而加固指标是指可以帮助增加对观察到的数据的信心的指标。点是操纵的结果。使用估计窗口来讨论数量和价格,估计窗口是指一些用户指定长度的先前数据点的集合。例如,可以使用先前定义的时间段内的移动平均值,这将允许讨论有关某些本地历史记录的峰值。这并不是说所提出的标准足以涵盖所有加密P& D。取而代之的是,我们选择诉诸于P& D所必需的保守标准,这些标准似乎是基于上一节中的信息而出现的。

为了获取数据进行分析,使用了CCXT(Ccxt 2018)库,该库提供了一种统一的方法,可以使用python编程语言以编程方式访问来自各种加密货币交易所的数据。尽管具有统一的访问权限,但交易所在其服务的历史数据量和已列出的加密货币方面仍存在差异。因此,必须决定要获取哪些数据。

可重现分析和数据检索的数据和代码可在https://osf.io/827wd/上公开获得。

加密货币在交易所中以符号对的形式列出,表示哪些货币与哪种货币交易。例如,要用莱特币(LTC)交换比特币(BTC),列出的符号对就是“ LTC / BTC”。交换数据作为一组开盘高低交易量(OHLCV)条目返回,详细说明该特定时间点的交易数据。表3以原始表示形式显示了OHLCV术语的示例,图3显示了OHLCV数据的烛台图表示形式。顶部和底部灯芯分别代表最高价和最低价,彩色蜡烛代表收盘价高于开盘价(绿色)还是低于开盘价(红色)。绿色蜡烛的顶部是收盘价,底部是开盘价,反之亦然。蜡烛可以代表各种时间范围,但通常代表30分钟,1小时或24小时。较小的蜡烛大小意味着每个时间段的数据更多,因此通常由于蜡烛大小限制,使用其API检索的数据量受到限制,因此蜡烛可以从交易所获取的天数更少。选择一小时蜡烛作为数据分辨率和可用历史数据量之间的折衷。

CCXT库(https://github.com/ccxt/ccxt)支持访问115种不同的加密货币交易所。但是,并非所有这些都允许公开检索历史数据。过滤掉这些条件后,剩下24个交换。为了使结果更可靠,对24个候选交换进行了进一步过滤,以与至少50个符号对和至少20天的历史1小时OHLCV数据进行交换。总共有五个交易所符合所有标准,并且从每个交易所中抽取了每个可用符号对的480蜡烛(〜20天)数据(请参阅附录)。

成功的P& D通常会出现明显的价格和数量飙升(请参阅表2),这可以通过人工观察轻松地发现。然而,由于成百上千的交换和符号配对,以及一天中不受特定时间限制的交易,所以仅依靠手工方法检测P& D是不切实际和不可行的。因此,我们诉诸使用异常检测的自动检测方法。

不符合数据集其余部分的数据点通常称为异常或离群值。异常检测是识别这些不合格点的过程(Chandola等,2009)。异常检测技术可以大致分为有监督和无监督异常检测。有监督的异常检测依赖于训练数据集来了解域的“正常”状态。后者取决于获得足够大小的训练集的能力,这通常是一项挑战。相反,无监督技术依赖于这样的假设,即异常现象很少出现在数据中,以防止过多的错误信号。在这里,研究人员或分析人员的任务是确定构成异常的参数。

有各种类型的异常,Chandola等人将其分为三大类。 (2009):点异常,集体异常和上下文异常。点异常仅仅是数据中与其余数据异常的点。一个例子是相对于个人的历史消费行为而言,一笔非常大的购买。另一方面,集体异常是指单个数据点本身可能不是异常的情况。而是同时出现或暂时接近

......