跳转到导航跳跃以搜索概率理论和跨期产品组合选择,凯利标准(或凯利策略或凯利赌注),也称为科学赌博方法,是一个赌注尺寸的公式,与任何相比,肯定会导致更高的财富其他策略在长期(即随着赌注的数量接近限制)。通过最大化财富对数的预期值来找到凯利赌注尺寸,这相当于最大化预期的几何增长率。凯利标准是为了投注预定的资产分数,似乎逆行。 1956年,贝尔实验室研究员J.L.Kelly JR描述了它。[1]
对于偶数赚钱,凯利标准通过将百分比乘以两个赢得两者来计算下注的百分比,然后减去百分之百。因此,对于赢得70%的胜利机会的赌注,最佳赌场尺寸为40%的可用资金。
已经证明了配方的实际使用用于赌博[2] [3],而且使用相同的想法来解释投资管理中的多样化。 [4]在2000年代,凯利风格的分析成为主流投资理论的一部分,并使索赔的索赔已经取得了众所周知的成功投资者,包括沃伦巴菲特[6]和账单总[7]使用凯利方法。威廉·库斯通撰写了一项广泛的凯利投注历史的普遍陈述。 [8]
在一项研究中,每位参与者都获得了25美元,并要求将甚至金币下注,这将占据60%的时间。参与者有30分钟的比赛,所以可以放置约300次投注,奖项收于250美元。测试对象的行为远非最佳:
值得注意的是,28%的参与者陷入了破产,平均支付只是91美元。只有21%的参与者达到了最大值。 61名参与者中的18人打赌一个折腾的一切,而在实验中的某个阶段,三分之二在尾巴上赌博。 [9] [10]
使用凯利标准并基于实验中的赔率(忽略250美元的帽和测试的有限持续时间),正确的方法是投注20%的一个'在每次掷硬币的折腾上请参阅下面的第一个例子)。如果失败,下注的大小被削减;如果获胜,股权会增加。如果讨论者遵循这条规则(假设投注有无限粒度,每场比赛有多达300枚硬币抛掷,那个达到帽子的球员将在此之后停止投注),平均94%的人将达到帽子,平均支付将是237.36美元。
在这个特殊的游戏中,由于帽子,每次折腾仅12%的罐子策略会产生更好的结果(达到帽的95%概率,平均支付242.03美元)。
对于简单的投注,有两个结果,涉及失去全部赌注,另一个涉及赢得赌注的乘积量乘以支付赔率,凯利赌注是:
f * = p - qb = bp - qb = bp - (1 - p)b = p(b + 1) - 1b {\ displaystyle f ^ {*} = p - {\ frac {q} {b}} = {\ frac {bp-q} {b}} = {\ frac {bp-(1-p)} {b}} {b}} {\ frac {p(b + 1)-1} {b}}}
f * {\ displaystyle f ^ {*}}是当前的资金赌博的分数; (即,在分数中表达的赌注是多少)
b {\ displaystyle b}是赌注上收到的净分数赔率; (例如,投注10美元,获胜,奖励4美元加上赌注;然后b = 0.4 {\ displaystyle b = 0.4})
作为一个例子,如果赌博有60%的获胜机会(p = 0.60 {\ displaystyle p = 0.60},q = 0.40 {\ displaystyle q = 0.40}),并且赌徒在a上接收1到1个赔率赢得投注(B = 1 {\ DisplayStyle B = 1}),赌徒应在每个机会下投注20%的资金(f * = 0.20 {\ displaystyle f ^ {*} = 0.20}),以最大化银行汇款的长期增长率。
如果赌徒具有零边缘,即如果b = q / p {\ displaystyle b = q / p},则标准建议赌徒投注任何内容。
如果边缘为负(B< q / p {\ displaystyle b< q / p}),则公式给出了负面结果,表明赌徒应该采取赌注的另一面。例如,在美国轮盘赌,在红色时,贝特托斯在红色时提供了偶数金钱支付(B = 1 {\ DisplayStyle B = 1}),当车轮上有18个红色和20个非红色数字时(P = 18 / 38 {\ displaystyle p = 18/38})。凯莉下注是 - 1/19 {\ displaystyle -119},这意味着赌徒应该打赌,第十九个是他们的银币,红色不会出现。在轮盘赌中没有出现明确的反红招,在轮盘赌中提供了可比的赔率,所以最好的凯利赌徒可以做任何事情都没有。
第一个分数的顶部是1美元赌注的预期净奖金,因为这两种结果是您使用概率p {\ displaystyle p}赢得$ b {\ displaystyle b},或丢失$ 1下注,即赢$ -1,具有概率q {\ displaystyle q}。因此:
f * =预期的净奖金净奖金如果您赢得{\ displaystyle f ^ {*} = {\ frac {\ text {present net winnings}} {\ text {net winnings如果您赢了}}}}
对于偶数押注(即,当B = 1 {\ DISPLAYSTYLE B = 1}时),可以简化第一公式:
如果您成功,您的投资价值从1 {\ DisplayStyle 1}增加到1 + B {\ DisplayStyle 1 + B}。
如果您失败(概率是Q = 1 - P {\ DisplayStyle Q = 1-P}),您的投资值从1 {\ DisplayStyle 1}减少到1 - a {\ displaystyle 1-a}。 (请注意,上述上述描述假定为{\ displaystyle a}为1.)
在这种情况下,正如在下一部分中所证明的那样,凯利标准转向是相对简单的表达式
注意,这减少了上面的特殊情况的原始表达式(f * = p-q {\ displaystyle f ^ {*} = p-q}),用于b = a = 1 {\ displaystyle b = a = 1}。
显然,为了决定投资至少少量(f *> 0){\ displaystyle(f ^ {*}> 0)},你必须拥有
这显然只不过是预期利润必须超过投资的预期损失,以便有任何意义。
一般结果澄清了为什么利用(取出需要支付兴趣的贷款以提高投资资本)降低了投资的最佳分数,就像这种情况一样A> 1 {\ displaystyle a> 1}。显然,无论成功的概率如何,P {\ DisplayStyle P}是多大的,如果一个{\ DisplayStyle a}足够大,则投资的最佳分数为零。因此,当资本成本高时,使用太多的利润不是良好的投资策略,即使机会似乎很有希望。
凯利标准的启发式证据很简单。 [11]凯利标准最大化财富对数的预期值(函数的期望值由总和给出的所有可能结果,每个特定结果的概率乘以事件中函数的值这一结果)。我们从1单位的财富单位开始,并在概率P {\ DisplayStyle P}的结果上投注该财富的F {\ DisplayStyle f},并提供B {\ DisplayStyle B}的次数。获胜的概率是p {\ displaystyle p},并且在这种情况下,得到的财富等于1 + f b {\ displaystyle 1 + fb}。丢失的概率是1 - p {\ displaystyle 1-p},并且在这种情况下,得到的财富等于1 - f {\ displaystyle 1-f}。因此,日志财富(e){\ displaystyle(e)}的预期值由以下提供:
e = p log(1 + f b)+(1 - p)log(1 - f){\ displaystyle e = p \ log(1 + fb)+(1-p)\ log(1-f)}
要找到最大值的f {\ displaystyle f}的值,表示为f * {\ displaystyle f ^ {* *}},我们将上面的表达式分析并将其设置为等于零。这给了:
d e d f | f = f * = pb 1 + f * b - 1 - p 1 - f * = 0 {\ displaystyle \左。{\ frac {de} {df}}右| = {f = f ^ {*}} = {\ frac {pb} {1 + f ^ {*} b} - {\ frac {1-p} {1-f ^ {*}}} = 0}
重新排列此方程以解决f * {\ displaystyle f ^ {*}}的值给出了凯利标准:
对于严谨和一般的证据,请参阅凯莉'原始纸张[1]或下面列出的其他参考文献。一些更正已发布。 [12]
我们为B = 1 {\ DisplayStyle B = 1}提供以下非严格论点(A 50:50"即使是金钱"赌注)以展示一般的想法并提供一些见解。 [1]
当B = 1 {\ DisplayStyle B = 1}时,凯利Bettor投注2 p - 1 {\ displaystyle 2p-1}次初始财富w {\ displaystyle w},如上所示。如果他们赢了,一个投注后它们有2个p w {\ displaystyle 2pw}。如果失效,它们有2(1 - P)W {\ DisplayStyle 2(1-P)W}。假设他们像这样做的n {\ displaystyle n}赌注,并在这一系列的n {\ displaystyle n}赌注中获胜k {\ displaystyle k}时间。由此产生的财富将是:
2 n p k(1 - p)n - k w。 {\ displaystyle 2 ^ {n} p ^ {k}(1-p)^ {n-k} w \!}
请注意,获胜和损失的排序不会影响由此产生的财富。
假设另一个投注者投注不同的量,(2 p-1 +Δ)w {\ displaystyle(2p-1 + \ delta)w}对于Δ{\ displaystyle \ delta}的某个值(其中Δ{\ displaystyle \ delta}为什么可能是积极的或负面的)。在WIN和[2(1 - P) - Δ] W {\ DisplayStyle [2(1-P) - \ delta] w之后,它们将具有(2 p +Δ)w {\ displaystyle(2p + \ delta)w}亏损后。在同一系列胜利和损失作为凯利·斯特托,他们将有:
(2 p +Δ)k [2(1 - p) - δ] n - k w {\ displaystyle(2p + \ delta)^ {k} [2(1-p) - \ delta] ^ {n-k} w}
K(2p +δ)k - 1 [2(1 - p) - δ] n - kw - (n - k)(2 p +δ)k [2(1 - p) - δ] n - k - 1 w {\ displaystyle k(2p + \ delta)^ {k-1} [2(1-p) - \ delta] ^ {nk} w-(nk)(2p + \ delta)^ {k} [2(1 -p) - \ delta] ^ {nk-1} w}
K [2(1 - p) - δ] =(n - k)(2 p +δ){\ displaystyle k [2(1-p) - \ delta] =(n-k)(2p + \ delta)}
lim n→+∞kn = p {\ displaystyle \ lim _ {n \ to + \ idty} {\ frac {k} {n}} = p}
因此,从长远来看,通过将Δ{\ displaystyle \ delta}设置为零,最终财富最大化,这意味着沿凯利策略。
这说明凯利具有确定性和随机分量。如果一个人知道k和n并希望每次挑选一个持续的财富费用(否则可以欺骗,例如,在知道其余的投注将失去的赌注之后释放零),一个将结束如果一个投注:
每一次。如果n {\ displaystyle n}小或大,则这是正确的。 "长期运行"凯莉的一部分是必要的,因为k未提前知道,只是n {\ displaystyle n}变大,k {\ displaystyle k}将接近p n {\ displaystyle pn}。如果k&gt,那些比凯莉更好的人可以做得更好; p n {\ displaystyle k> pn}伸展;如果k<,那些投注少于凯利的人可以做得更好p n {\ displaystyle k< pn}伸展,但从长远来看,凯莉总是胜利。
在单一的试验中,如果您投资首都的F {\ DisplayStyle F},如果您的策略成功,则在试验结束时的资本增加因子1 - F + F(1 + B)= 1 + FB {\ DisplayStyle 1-F + F(1 + B)= 1 + FB},同样,如果策略失败,则最终将您的资本减少1 - FA {\ DisplayStyle 1-Fa}。因此,在n {\ displaystyle n}试验的末尾(使用p n {\ displaystyle pn}和q n {\ displaystyle qn}故障),起始资本为1美元的产量
c n =(1 + f b)p n(1 - f a)q n。 {\ displaystyle c_ {n} =(1 + fb)^ {pn}(1-fa)^ {qn}。}
最大化日志(n)/ n {\ displaystyle \ log(c_ {n})/ n},并且相对于f {\ displaystyle f}导致所需的结果:c n {\ displaystyle c_ {n}}
Edward O. Thorp为一般情况提供了对该公式的更详细的讨论。 [13]在那里,可以看出,P {\ DisplayStyle P}的替换为&#34的数量的比率;成功"对于试验的数量意味着试验的数量必须非常大,因为P {\ DisplayStyle P}被定义为此比率的限制,因为随着试验的数量进入无限。简而言之,投注f * {\ displaystyle f ^ {*}}每次都可能在试验数量非常大的情况下最大化财富增长率,并且p {\ displaystyle p}和b {\ displaystyle b每次试验都是一样的。在实践中,这是一遍又一遍地玩同样的游戏的问题,其中获胜的概率和支付赔率总是相同的。在上面的启发式证据中,P n {\ displaystyle pn}成功和q n {\ displaystyle qn}失败很可能仅适用于非常大的n {\ displaystyle n}。
在1738年的文章中,DanielBernoulli建议,当一个人选择投注或投资时,应该选择具有最高几何成果的最高几何平均值。这是在数学上等同于凯利标准,尽管动机完全不同(Bernoulli想要解决圣彼得堡Paradox)。
Bernoulli文章的英语翻译未出版,直到1954年,[14],但该工作在数学家和经济学家中都是众所周知的。
Kelly' S标准可以是广泛化的[15]在许多互斥结果上赌博,例如在赛马场中。假设有几个互斥的结果。 k {\ displaystyle k} -th马赢得比赛的概率是pk {\ displaystyle p_ {k}},放置在k {\ displaystyle k} -th hore上的投注量是b k {\ displaystyle b_ {k}},和
βk= Bkσ1bi = d 1 + q k,{\ displaystyle \ beta _ {k} = {\ frac {b_ {k}} {\ sum _ {i} b_ {i}}} = { \ frac {d} {1 + q_ {k}}},}
其中q k {\ displaystyle q_ {k}}是退行赔率。 d = 1 - tt {\ displaystyle d = 1-tt},是tt {\ displaystyle tt}是轨道采取或税的股息率,dβk{\ displaystyle {\ frac {d} {\ beta _ { k}}}是扣除轨道后的收入率,当k {\ displaystyle k} -th horse wins时。 Bettor'在k {\ displaystyle k} -th horse上打赌的资金是f k {\ displaystyle f_ {k}}。凯莉'使用多种互斥结果的赌博标准给出了一个用于查找最佳集合的o {\ displaystyle s ^ {o}的算法,其结果是合理的,并且它提供了用于查找最佳的公式FKO {\ displaystyle f_ {k} ^ {o}'在最佳集S o {\ displaystyle s ^ {o}}中的结果中投注的财富。最佳集合算法结果由四个步骤组成。 [15]
第1步:计算所有可能的预期收入率(或仅适用于最有前途的几个)结果:ERI = D PIβi= PI(Q I + 1){\ DISPLAYSTYLE ER_ {i} = {\ FRAC {DP_ {i}} {\ beta _ {i}}} = p_ {i}(q_ {i} +1)}
步骤2:重新排序结果,以便新序列E R K {\ DisplayStyle er_ {k}}不上增加。因此,e r 1 {\ displaystyle er_ {1}}将是最好的选择。
步骤3:SET S =∅{\ DIMPLESSTYLE S = \ varnothing}(空集),k = 1 {\ displaystyle k = 1},r(s)= 1 {\ displaystyle r(s)= 1}。因此,首先考虑最好的下注e r k = e r 1 {\ displaystyle er_ {k} = er_ {1}}。
步骤4:重复:如果E R K =DβKP k> R(S){\的DisplayStyle ER_ {K} = {\压裂{d} {\测试_ {K}}} P_ {K}> R(S)},然后插入ķ{\的DisplayStyleķ}个结果到该集:s = s∪{k} {\ displaystyle s = s \ cup \ {k \}},重新计算R(s){\ displaystyle r(s)}根据公式:r(s)= dσ k∉s pk d - σk∈sβk{\ displaystyle r(s)= {\ frac {d \ sum _ {k \ notin s} p_ {k}} {d- \ sum _ {k \然后设置k = k + 1 {\ displaystyle k = k + 1},然后设置k = k + {k}}}。
如果最佳集合S O {\ DisplayStyle s ^ {o}}为空,则根本不会打赌。如果最佳结果的SET S O {\ displaystyle s ^ {o}}不为空,则最佳分数fko {\ displaystyle f_ {k} ^ {o}}下注k {\ displaystyle k} -th结果可以从这个公式计算:
fi = pi - βiσk∉spk(d - σk∈sβk){\ displaystyle f_ {i} = p_ {i} - \ beta _ {i} {\ frac {\ sum _ {k \ notin S} P_ {K}} {(D- \总和_ {ķ\在S} \测试_ {K})}}}。
r(s o)= 1 - σi∈Sofoio {\ displaystyle r(s ^ {o})= 1- \ sum _ {i \ in s ^ {o}} {f_ {i} ^ {o}} }
右手侧是储备率[需要澄清]。因此,要求E r k = dβkp k> R(S){\的DisplayStyle ER_ {K} = {\压裂{d} {\测试_ {K}}} P_ {K}> R(S)}可以被解释[15]如下:K {\如果且仅当其预期收入率大于储备率时,才包含在最佳结果的Set S O {\ DisplayStyle S ^ {o}}中包含的显示状态k}。最佳分数Fko {\ DisplayStyle f_ {k {k} ^ {o}}的公式可以被解释为超过扣除扣除后的储备率的k {\ displaystyle k} -th马的预期收入率。在扣除后除以收入当k {\ displaystyle k} -th horke in或过多的k {\ displaystyle k} -th horse赢得储备率后的概率时,追逐追踪轨道后追逐赛道{\显示器k} -th horse wins。二元生长指数是
g o =σi∈Sp i lo
......