凯莉标准

2021-04-16 23:41:22

跳转到导航跳跃以搜索概率理论和跨期产品组合选择，凯利标准（或凯利策略或凯利赌注），也称为科学赌博方法，是一个赌注尺寸的公式，与任何相比，肯定会导致更高的财富其他策略在长期（即随着赌注的数量接近限制）。通过最大化财富对数的预期值来找到凯利赌注尺寸，这相当于最大化预期的几何增长率。凯利标准是为了投注预定的资产分数，似乎逆行。 1956年，贝尔实验室研究员J.L.Kelly JR描述了它。[1]

对于偶数赚钱，凯利标准通过将百分比乘以两个赢得两者来计算下注的百分比，然后减去百分之百。因此，对于赢得70％的胜利机会的赌注，最佳赌场尺寸为40％的可用资金。

已经证明了配方的实际使用用于赌博[2] [3]，而且使用相同的想法来解释投资管理中的多样化。 [4]在2000年代，凯利风格的分析成为主流投资理论的一部分，并使索赔的索赔已经取得了众所周知的成功投资者，包括沃伦巴菲特[6]和账单总[7]使用凯利方法。威廉·库斯通撰写了一项广泛的凯利投注历史的普遍陈述。 [8]

在一项研究中，每位参与者都获得了25美元，并要求将甚至金币下注，这将占据60％的时间。参与者有30分钟的比赛，所以可以放置约300次投注，奖项收于250美元。测试对象的行为远非最佳：

值得注意的是，28％的参与者陷入了破产，平均支付只是91美元。只有21％的参与者达到了最大值。 61名参与者中的18人打赌一个折腾的一切，而在实验中的某个阶段，三分之二在尾巴上赌博。 [9] [10]

使用凯利标准并基于实验中的赔率（忽略250美元的帽和测试的有限持续时间），正确的方法是投注20％的一个＆＃39;在每次掷硬币的折腾上请参阅下面的第一个例子）。如果失败，下注的大小被削减;如果获胜，股权会增加。如果讨论者遵循这条规则（假设投注有无限粒度，每场比赛有多达300枚硬币抛掷，那个达到帽子的球员将在此之后停止投注），平均94％的人将达到帽子，平均支付将是237.36美元。

在这个特殊的游戏中，由于帽子，每次折腾仅12％的罐子策略会产生更好的结果（达到帽的95％概率，平均支付242.03美元）。

对于简单的投注，有两个结果，涉及失去全部赌注，另一个涉及赢得赌注的乘积量乘以支付赔率，凯利赌注是：

f * = p - qb = bp - qb = bp - （1 - p）b = p（b + 1） - 1b {\ displaystyle f ^ {*} = p - {\ frac {q} {b}} = {\ frac {bp-q} {b}} = {\ frac {bp-（1-p）} {b}} {b}} {\ frac {p（b + 1）-1} {b}}}

f * {\ displaystyle f ^ {*}}是当前的资金赌博的分数; （即，在分数中表达的赌注是多少）

b {\ displaystyle b}是赌注上收到的净分数赔率; （例如，投注10美元，获胜，奖励4美元加上赌注;然后b = 0.4 {\ displaystyle b = 0.4}）

作为一个例子，如果赌博有60％的获胜机会（p = 0.60 {\ displaystyle p = 0.60}，q = 0.40 {\ displaystyle q = 0.40}），并且赌徒在a上接收1到1个赔率赢得投注（B = 1 {\ DisplayStyle B = 1}），赌徒应在每个机会下投注20％的资金（f * = 0.20 {\ displaystyle f ^ {*} = 0.20}），以最大化银行汇款的长期增长率。

如果赌徒具有零边缘，即如果b = q / p {\ displaystyle b = q / p}，则标准建议赌徒投注任何内容。

如果边缘为负（B＆lt; q / p {\ displaystyle b＆lt; q / p}），则公式给出了负面结果，表明赌徒应该采取赌注的另一面。例如，在美国轮盘赌，在红色时，贝特托斯在红色时提供了偶数金钱支付（B = 1 {\ DisplayStyle B = 1}），当车轮上有18个红色和20个非红色数字时（P = 18 / 38 {\ displaystyle p = 18/38}）。凯莉下注是 - 1/19 {\ displaystyle -119}，这意味着赌徒应该打赌，第十九个是他们的银币，红色不会出现。在轮盘赌中没有出现明确的反红招，在轮盘赌中提供了可比的赔率，所以最好的凯利赌徒可以做任何事情都没有。

第一个分数的顶部是1美元赌注的预期净奖金，因为这两种结果是您使用概率p {\ displaystyle p}赢得$ b {\ displaystyle b}，或丢失$ 1下注，即赢$ -1，具有概率q {\ displaystyle q}。因此：

f * =预期的净奖金净奖金如果您赢得{\ displaystyle f ^ {*} = {\ frac {\ text {present net winnings}} {\ text {net winnings如果您赢了}}}}

对于偶数押注（即，当B = 1 {\ DISPLAYSTYLE B = 1}时），可以简化第一公式：

如果您成功，您的投资价值从1 {\ DisplayStyle 1}增加到1 + B {\ DisplayStyle 1 + B}。

如果您失败（概率是Q = 1 - P {\ DisplayStyle Q = 1-P}），您的投资值从1 {\ DisplayStyle 1}减少到1 - a {\ displaystyle 1-a}。（请注意，上述上述描述假定为{\ displaystyle a}为1.）

在这种情况下，正如在下一部分中所证明的那样，凯利标准转向是相对简单的表达式

注意，这减少了上面的特殊情况的原始表达式（f * = p-q {\ displaystyle f ^ {*} = p-q}），用于b = a = 1 {\ displaystyle b = a = 1}。

显然，为了决定投资至少少量（f *＆gt; 0）{\ displaystyle（f ^ {*}＆gt; 0）}，你必须拥有

这显然只不过是预期利润必须超过投资的预期损失，以便有任何意义。

一般结果澄清了为什么利用（取出需要支付兴趣的贷款以提高投资资本）降低了投资的最佳分数，就像这种情况一样A＆GT; 1 {\ displaystyle a＆gt; 1}。显然，无论成功的概率如何，P {\ DisplayStyle P}是多大的，如果一个{\ DisplayStyle a}足够大，则投资的最佳分数为零。因此，当资本成本高时，使用太多的利润不是良好的投资策略，即使机会似乎很有希望。

凯利标准的启发式证据很简单。 [11]凯利标准最大化财富对数的预期值（函数的期望值由总和给出的所有可能结果，每个特定结果的概率乘以事件中函数的值这一结果）。我们从1单位的财富单位开始，并在概率P {\ DisplayStyle P}的结果上投注该财富的F {\ DisplayStyle f}，并提供B {\ DisplayStyle B}的次数。获胜的概率是p {\ displaystyle p}，并且在这种情况下，得到的财富等于1 + f b {\ displaystyle 1 + fb}。丢失的概率是1 - p {\ displaystyle 1-p}，并且在这种情况下，得到的财富等于1 - f {\ displaystyle 1-f}。因此，日志财富（e）{\ displaystyle（e）}的预期值由以下提供：

e = p log⁡（1 + f b）+（1 - p）log⁡（1 - f）{\ displaystyle e = p \ log（1 + fb）+（1-p）\ log（1-f）}

要找到最大值的f {\ displaystyle f}的值，表示为f * {\ displaystyle f ^ {* *}}，我们将上面的表达式分析并将其设置为等于零。这给了：

d e d f | f = f * = pb 1 + f * b - 1 - p 1 - f * = 0 {\ displaystyle \左。{\ frac {de} {df}}右| = {f = f ^ {*}} = {\ frac {pb} {1 + f ^ {*} b} - {\ frac {1-p} {1-f ^ {*}}} = 0}

重新排列此方程以解决f * {\ displaystyle f ^ {*}}的值给出了凯利标准：

对于严谨和一般的证据，请参阅凯莉＆＃39;原始纸张[1]或下面列出的其他参考文献。一些更正已发布。 [12]

我们为B = 1 {\ DisplayStyle B = 1}提供以下非严格论点（A 50:50＆＃34;即使是金钱＆＃34;赌注）以展示一般的想法并提供一些见解。 [1]

当B = 1 {\ DisplayStyle B = 1}时，凯利Bettor投注2 p - 1 {\ displaystyle 2p-1}次初始财富w {\ displaystyle w}，如上所示。如果他们赢了，一个投注后它们有2个p w {\ displaystyle 2pw}。如果失效，它们有2（1 - P）W {\ DisplayStyle 2（1-P）W}。假设他们像这样做的n {\ displaystyle n}赌注，并在这一系列的n {\ displaystyle n}赌注中获胜k {\ displaystyle k}时间。由此产生的财富将是：

2 n p k（1 - p）n - k w。 {\ displaystyle 2 ^ {n} p ^ {k}（1-p）^ {n-k} w \！}

请注意，获胜和损失的排序不会影响由此产生的财富。

假设另一个投注者投注不同的量，（2 p-1 +Δ）w {\ displaystyle（2p-1 + \ delta）w}对于Δ{\ displaystyle \ delta}的某个值（其中Δ{\ displaystyle \ delta}为什么可能是积极的或负面的）。在WIN和[2（1 - P） - Δ] W {\ DisplayStyle [2（1-P） - \ delta] w之后，它们将具有（2 p +Δ）w {\ displaystyle（2p + \ delta）w}亏损后。在同一系列胜利和损失作为凯利·斯特托，他们将有：

（2 p +Δ）k [2（1 - p） - δ] n - k w {\ displaystyle（2p + \ delta）^ {k} [2（1-p） - \ delta] ^ {n-k} w}

K（2p +δ）k - 1 [2（1 - p） - δ] n - kw - （n - k）（2 p +δ）k [2（1 - p） - δ] n - k - 1 w {\ displaystyle k（2p + \ delta）^ {k-1} [2（1-p） - \ delta] ^ {nk} w-（nk）（2p + \ delta）^ {k} [2（1 -p） - \ delta] ^ {nk-1} w}

K [2（1 - p） - δ] =（n - k）（2 p +δ）{\ displaystyle k [2（1-p） - \ delta] =（n-k）（2p + \ delta）}

lim n→+∞kn = p {\ displaystyle \ lim _ {n \ to + \ idty} {\ frac {k} {n}} = p}

因此，从长远来看，通过将Δ{\ displaystyle \ delta}设置为零，最终财富最大化，这意味着沿凯利策略。

这说明凯利具有确定性和随机分量。如果一个人知道k和n并希望每次挑选一个持续的财富费用（否则可以欺骗，例如，在知道其余的投注将失去的赌注之后释放零），一个将结束如果一个投注：

每一次。如果n {\ displaystyle n}小或大，则这是正确的。＆＃34;长期运行＆＃34;凯莉的一部分是必要的，因为k未提前知道，只是n {\ displaystyle n}变大，k {\ displaystyle k}将接近p n {\ displaystyle pn}。如果k＆gt，那些比凯莉更好的人可以做得更好; p n {\ displaystyle k＆gt; pn}伸展;如果k＆lt;，那些投注少于凯利的人可以做得更好p n {\ displaystyle k＆lt; pn}伸展，但从长远来看，凯莉总是胜利。

在单一的试验中，如果您投资首都的F {\ DisplayStyle F}，如果您的策略成功，则在试验结束时的资本增加因子1 - F + F（1 + B）= 1 + FB {\ DisplayStyle 1-F + F（1 + B）= 1 + FB}，同样，如果策略失败，则最终将您的资本减少1 - FA {\ DisplayStyle 1-Fa}。因此，在n {\ displaystyle n}试验的末尾（使用p n {\ displaystyle pn}和q n {\ displaystyle qn}故障），起始资本为1美元的产量

c n =（1 + f b）p n（1 - f a）q n。 {\ displaystyle c_ {n} =（1 + fb）^ {pn}（1-fa）^ {qn}。}

最大化日志⁡（n）/ n {\ displaystyle \ log（c_ {n}）/ n}，并且相对于f {\ displaystyle f}导致所需的结果：c n {\ displaystyle c_ {n}}

Edward O. Thorp为一般情况提供了对该公式的更详细的讨论。 [13]在那里，可以看出，P {\ DisplayStyle P}的替换为＆＃34的数量的比率;成功＆＃34;对于试验的数量意味着试验的数量必须非常大，因为P {\ DisplayStyle P}被定义为此比率的限制，因为随着试验的数量进入无限。简而言之，投注f * {\ displaystyle f ^ {*}}每次都可能在试验数量非常大的情况下最大化财富增长率，并且p {\ displaystyle p}和b {\ displaystyle b每次试验都是一样的。在实践中，这是一遍又一遍地玩同样的游戏的问题，其中获胜的概率和支付赔率总是相同的。在上面的启发式证据中，P n {\ displaystyle pn}成功和q n {\ displaystyle qn}失败很可能仅适用于非常大的n {\ displaystyle n}。

在1738年的文章中，DanielBernoulli建议，当一个人选择投注或投资时，应该选择具有最高几何成果的最高几何平均值。这是在数学上等同于凯利标准，尽管动机完全不同（Bernoulli想要解决圣彼得堡Paradox）。

Bernoulli文章的英语翻译未出版，直到1954年，[14]，但该工作在数学家和经济学家中都是众所周知的。

Kelly＆＃39; S标准可以是广泛化的[15]在许多互斥结果上赌博，例如在赛马场中。假设有几个互斥的结果。 k {\ displaystyle k} -th马赢得比赛的概率是pk {\ displaystyle p_ {k}}，放置在k {\ displaystyle k} -th hore上的投注量是b k {\ displaystyle b_ {k}}，和

βk= Bkσ1bi = d 1 + q k，{\ displaystyle \ beta _ {k} = {\ frac {b_ {k}} {\ sum _ {i} b_ {i}}} = { \ frac {d} {1 + q_ {k}}}，}

其中q k {\ displaystyle q_ {k}}是退行赔率。 d = 1 - tt {\ displaystyle d = 1-tt}，是tt {\ displaystyle tt}是轨道采取或税的股息率，dβk{\ displaystyle {\ frac {d} {\ beta _ { k}}}是扣除轨道后的收入率，当k {\ displaystyle k} -th horse wins时。 Bettor＆＃39;在k {\ displaystyle k} -th horse上打赌的资金是f k {\ displaystyle f_ {k}}。凯莉＆＃39;使用多种互斥结果的赌博标准给出了一个用于查找最佳集合的o {\ displaystyle s ^ {o}的算法，其结果是合理的，并且它提供了用于查找最佳的公式FKO {\ displaystyle f_ {k} ^ {o}＆＃39;在最佳集S o {\ displaystyle s ^ {o}}中的结果中投注的财富。最佳集合算法结果由四个步骤组成。 [15]

第1步：计算所有可能的预期收入率（或仅适用于最有前途的几个）结果：ERI = D PIβi= PI（Q I + 1）{\ DISPLAYSTYLE ER_ {i} = {\ FRAC {DP_ {i}} {\ beta _ {i}}} = p_ {i}（q_ {i} +1）}

步骤2：重新排序结果，以便新序列E R K {\ DisplayStyle er_ {k}}不上增加。因此，e r 1 {\ displaystyle er_ {1}}将是最好的选择。

步骤3：SET S =∅{\ DIMPLESSTYLE S = \ varnothing}（空集），k = 1 {\ displaystyle k = 1}，r（s）= 1 {\ displaystyle r（s）= 1}。因此，首先考虑最好的下注e r k = e r 1 {\ displaystyle er_ {k} = er_ {1}}。

步骤4：重复：如果E R K =DβKP k＆gt; R（S）{\的DisplayStyle ER_ {K} = {\压裂{d} {\测试_ {K}}} P_ {K}＆GT; R（S）}，然后插入ķ{\的DisplayStyleķ}个结果到该集：s = s∪{k} {\ displaystyle s = s \ cup \ {k \}}，重新计算R（s）{\ displaystyle r（s）}根据公式：r（s）= dσ k∉s pk d - σk∈sβk{\ displaystyle r（s）= {\ frac {d \ sum _ {k \ notin s} p_ {k}} {d- \ sum _ {k \然后设置k = k + 1 {\ displaystyle k = k + 1}，然后设置k = k + {k}}}。

如果最佳集合S O {\ DisplayStyle s ^ {o}}为空，则根本不会打赌。如果最佳结果的SET S O {\ displaystyle s ^ {o}}不为空，则最佳分数fko {\ displaystyle f_ {k} ^ {o}}下注k {\ displaystyle k} -th结果可以从这个公式计算：

fi = pi - βiσk∉spk（d - σk∈sβk）{\ displaystyle f_ {i} = p_ {i} - \ beta _ {i} {\ frac {\ sum _ {k \ notin S} P_ {K}} {（D- \总和_ {ķ\在S} \测试_ {K}）}}}。

r（s o）= 1 - σi∈Sofoio {\ displaystyle r（s ^ {o}）= 1- \ sum _ {i \ in s ^ {o}} {f_ {i} ^ {o}} }

右手侧是储备率[需要澄清]。因此，要求E r k = dβkp k＆gt; R（S）{\的DisplayStyle ER_ {K} = {\压裂{d} {\测试_ {K}}} P_ {K}＆GT; R（S）}可以被解释[15]如下：K {\如果且仅当其预期收入率大于储备率时，才包含在最佳结果的Set S O {\ DisplayStyle S ^ {o}}中包含的显示状态k}。最佳分数Fko {\ DisplayStyle f_ {k {k} ^ {o}}的公式可以被解释为超过扣除扣除后的储备率的k {\ displaystyle k} -th马的预期收入率。在扣除后除以收入当k {\ displaystyle k} -th horke in或过多的k {\ displaystyle k} -th horse赢得储备率后的概率时，追逐追踪轨道后追逐赛道{\显示器k} -th horse wins。二元生长指数是

g o =σi∈Sp i lo

......

https://en.wikipedia.org/wiki/Kelly_criterion

tags users