最佳停止

2021-04-06 07:43:37

跳转到导航跳转以搜索数学,最佳停止[1] [2]或早期停止[3]涉及选择时间采取特定行动的问题,以最大限度地提高预期的奖励或最小化预期成本。最佳停止问题可以在统计,经济学和数学融资领域找到(与美国选项的定价有关)。最佳停止问题的一个关键例子是秘书问题。最佳停止问题通常可以以Bellman方程的形式写入,因此通常使用动态编程来解决。

一系列随机变量x 1,x 2,... {\ displaystyle x_ {1},x_ {2},\ ldots},其联合分布是假设知道的

'奖励'函数(yi)i≥1{\ displaystyle(y_ {i})_ {i \ geq 1}}取决于1:yi = yi(x 1,...,xi){\ displaystyle y_ {i} = y_ {i}(x_ {1},\ ldots,x_ {i})}

您正在观察随机变量的序列,并且在每个步骤I {\ DisplayStyle i},您可以选择停止观察或继续

如果您在步骤i {\ displaystyle i}停止观察,您将收到奖励y i {\ displaystyle y_ {i}}

您想选择一个停止规则,以最大限度地提高您的预期奖励(或等效,最小化您的预期损失)

考虑增益过程G =(g t)t≥0{\ displaystyle g =(g_ {t})_ {t \ geq 0}}在滤波后的概率空间(ω,f,(f t)t≥0上定义,p){\ displaystyle(\ omega,{\ mathcal {f}},({\ mathcal {f}} _ {t})_ {t \ geq 0},\ mathbb {p})}并假设g {\ displaystyle g}适用于过滤。最佳停止问题是找到最大化预期增益的停止时间τ* {\ displaystyle \ tau ^ {*}}

v t t =例如τ* = supt≤τ≤tegτ{\ displaystyle v_ {t} ^ {t} = \ mathbb {e} g _ {\ tau ^ {*}} = \ sup _ {t \ leq \ tau \ leq t} \ mathbb {e} g _ {\ tau}}

其中V t t {\ displaystyle v_ {t} ^ {t}}称为值函数。这里t {\ displaystyle t}可以取值∞{\ displaystyle \ infty}。

更具体的制剂如下。我们考虑一个适应的强烈的马尔可夫过程x =(x t)t≥0{\ displaystyle x =(x_ {t})_ {t \ geq 0} _ {t \ geq 0}}在滤波后的概率空间(ω,f,f t)上定义t≥0,p x){\ displaystyle(\ omega,{\ mathcal {f}},({\ mathcal {f}} _ {t})_ {t \ geq 0},\ mathbb {p} _ { x})其中p x {\ displaystyle \ mathbb {p} _ {x}}表示随机过程在x {\ displaystyle x}开始的概率测量。给定连续函数m,l {\ displaystyle m,l}和k {\ displaystyle k},最佳停止问题是

v(x)= sup0≤τ≤tex(m(xτ)+≠0τl(x t)d t + sup0≤t≤τk(x t))。 {\ displaystyle v(x)= \ sup _ {0 \ leq \ tau \ Leq t} \ mathbb {e} _ {x} \ left(m(x _ {\ tau})+ \ int _ {0} ^ { \ tau} l(x_ {t})dt + \ sup _ {0 \ leq t \ leq \ tau} k(x_ {t})\右)。}

这有时称为MLS(分别代表Mayer,Lagrange和Suplimum)的制定。 [4]

求解最佳停止问题的方法通常有两种方法。 [4]当底层过程(或增益过程)由其无条件有限维分布描述时,适当的解决方案技术是鞅方法,所以所谓的,因为它使用Martingale理论,最重要的概念是斯内尔信封。在离散时间案例中,如果规划地平线t {\ displaystyle t}是有限的,则问题也可以通过动态编程轻松解决问题。

当基础过程由导致马尔可夫家族的过渡概率的家庭(条件)转变函数决定时,通常使用由马尔可夫过程理论提供的强大的分析工具,并且这种方法被称为Markov方法。该解决方案通常通过求解相关的自由边界问题(Stefan问题)来获得。

让y t {\ displaystyle y_ {t}是sde给出的r k {\ displaystyle \ mathbb {r} ^ {k}}中的levy扩散

D Y T = B(Y T)DT +σ(Y T)D B T +∫RKγ(Y T - ,Z)n(dt,dz),y 0 = y {\ displaystyle dy_ {t} = b(y_ {t})dt + \ sigma(y_ {t})db_ {t} + \ in _ {\ mathbb {r} ^ {k}} \ gamma(y_ {t-},z){\ bar {n}}(dt,dz),\四y_ {0} = y}

其中b {\ displaystyle b}是m {\ displaystyle m} -dimensional brownian运动,n¯{\ displaystyle {\ bar {n}}是l {\ displaystyle l} -dimensional补偿泊松随机测量,b: r k→r k {\ displaystyle b:\ mathbb {r} ^ {k} \ to \ mathbb {r} ^ {k}},σ:r k→r k×m {\ displaystyle \ sigma:\ mathbb { r} ^ {k} \ to \ mathbb {r} ^ {k \ times m}},γ:r k×r k→r k×l {\ displaystyle \ gamma:\ mathbb {r} ^ {k} \ times \ MathBB {R} ^ {k} \ to \ mathbb {r} ^ {k \ times l}}给出了唯一解决方案(y t){\ displaystyle(y__ {t})}。让s∈Rk {\ displaystyle {\ mathcal {s}} \ subset \ mathbb {r} ^ {k} ^ {k}}是一个打开的集合(偿付能力区域)和

τs = inf {t> 0:y t∉s} {\ displaystyle \ tau _ {\ mathcal {s}} = \ inf \ {t> 0:y_ {t} \ ottin {\ mathcal {s}} \}}

v(y)= supτ≤τs jτ(y)= supτ≤τs e y [m(yτ)+∫0τl(Y t)d t]。 {\ displaystyle v(y)= \ sup _ {\ tau \ leq \ tau _ {\ mathcal {s}}} j ^ {\ tau}(y)= \ sup _ {\ tau \ leq \ tau _ {\ mathcal {s}}} \ mathbb {e} _ {y} \ left [m(y_ {\ tau})+ \ int _ {0} ^ {\ tau} l(y_ {t})dt \ rothing]。 }

如果函数φ:s→r {\ displaystyle \ phi:{\ bar {\ mathcal {s}}} \ to \ mathbb {r}}满足

Φ∈C(s)∩c 1(s)∩c 2(s∖∂d){\ displaystyle \ phi \在c中({\ bar {\ mathcal {s}})\ cap c ^ {1} ({\ mathcal {s}})\ cap c ^ {2}({\ mathcal {s}} \ setminus \ partial d)}其中延续区域是d = {y∈S:φ(y)> m(y)} {\ displaystyle d = \ {y \在{\ mathcal {s}}:\ phi(y)> m(y)\}},

aφ+l≤0{\ displaystyle {\ mathcal {a}} \ phi + l \ leq 0}在s∈∂d {\ displaystyle {\ mathcal {s}} \ setminus \ partial d}上,其中a {\ displaystyle {\ mathcal {a}}}是(y t){\ displaystyle(y_ {t})}的无限生成器

然后Φ(y)≥v(y){\ displaystyle \ phi(y)\ geq v(y)}对于{\ bar {\ mathcal {s}}}}}} {\ displaystyle y \。而且,如果

然后φ(y)= v(y){\ displaystyle \ phi(y)= v(y)}对于{\ bar {\ mathcal {s}}}}}}和τs{\ displaystyle y \ * = INF {T> 0:yt∈D} {\ displaystyle \ tau ^ {*} = \ inf \ {t> 0:y_ {t} \ notin d \}}是一个最佳停止时间。

max {aφ+ l,m - φ} = 0 {\ displaystyle \ max \ left \ {{\ mathcal {a}} \ phi + l,m- \ phi \ rick \} = 0}在s∖∂d上。 {\ displaystyle {\ mathcal {s}} \ setminus \ partial d.}

你有一个公平的硬币,并反复折腾它。每次,在它抛出之前,你可以选择停止折腾并获得报酬(以美元为单位)观察到的平均头数。

您希望通过选择停止规则来最大限度地提高您获得的金额。如果x i(对于i≥1)形成一系列独立的,与Bernoulli分发相同分布的随机变量

y i = 1 iσk= 1 i x k {\ displaystyle y_ {i} = {\ frac {1} {i}}} \ sum _ {k = 1} ^ {i} x_ {k}}

然后序列(x i)i≥1{\ displaystyle(x_ {i})_ {i \ geq 1}},(yi)i≥1{\ displaystyle(y_ {i})_ {i \ geq 1 }}是与此问题相关联的对象。

(e(y i){\ displaystyle \ mathbb {e}(y_ {i})}不一定会收敛)

你有房子,希望卖掉它。每天为您的房子提供X N {\ DisplayStyle X_ {n}},并支付k {\ displaystyle k}以继续广告它。如果您在Day {\ DisplayStyle n}时出售您的房子,您将获得YN {\ DisplayStyle Y_ {n}},其中Yn =(x n - nk){\ displaystyle y_ {n} =(x_ {n} - nk)}。

在此示例中,序列(x i {\ displaystyle x_ {i}})是您房屋的优惠序列,奖励功能的顺序是您将获得多少。

您正在观察一系列可以从最坏的排名的对象。您希望选择一个停止规则,最大化您选择最佳对象的机会。

这里,如果r 1,...,r n {\ displaystyle r_ {1},\ ldots,r_ {n}}(n是一些大数字)是对象的等级,而yi {\ displaystyle y_ {i}}如果您在步骤i中停止故意拒绝对象(R i){\ displaystyle(r_ {i})},并且(yi){\ displaystyle(y_ {i})},则挑选最佳对象与这个问题有关。这个问题在20世纪60年代初由几个人解决了。通过最近的最佳停止次数算法(Bruss算法),提供了对秘书问题的优雅解决问题及此问题的修改。

经济学家研究了一些类似于&#39的最佳停止问题;秘书问题&#39 ;,通常称为这种类型的分析'搜索理论'搜索理论尤其专注于工人'搜索高工资工作,或消费者和#39;搜索低价的好处。

搜索理论应用的一个特殊例子是驾驶员将驾驶员(剧院,购物等)最佳选择停车位的任务。接近目的地,司机沿着哪些停车位沿着哪些停车位 - 通常,只有停车场的一些地方是免费的。目标清晰可见,因此距离目标的距离很容易评估。司机' s任务是选择尽可能靠近目的地的免费停车位,而不会转动,使从这个地方到目的地的距离是最短的。 [6]

在金融市场的备选方案交易中,美式期权的持有人可在到期日或在到期日之前或以前的任何时间行使购买(或出售)潜在资产的权利。因此,美国选项的估值基本上是最佳的停止问题。考虑一个古典的黑人学员设置,让R {\ DisplayStyle r}是无风险的利率和Δ{\ displaystyle \ delta}和σ{\ displaystyle \ sigma}是股票的股息率和波动性。股价s {\ displaystyle s}跟随几何布朗运动

s t = s 0exp⁡{(r - Δ-σ22)t +σbt} {\ displaystyle s_ {t} = s_ {0} \ exp \ left \ {\ left(r- \ delta - { \ frac {\ sigma ^ {2}}}}} {2}} \右)t + \ sigma b_ {t} \ light \}}

v(x)=supτex [e-rτg(sτ)] {\ displaystyle v(x)= \ sup _ {\ tau} \ mathbb {e} _ {x} \ left [e ^ { -r \ tau} g(s _ {\ tau})\右]}

回收函数是g(x)=(x-k)+ {\ displaystyle g(x)=(xk)^ {+}}对于呼叫选项,g(x)=(k - x)+ {\显示Style G(x)=(kx)^ {+}}为put选项。变分不等式是

max {12σ2x 2 v“(x)+(r - δ)x v'(x) - r v(x),g(x) - v(x)} = 0 {\ displaystyle \ max \左\ {{\ frac {1} {2}} \ sigma ^ {2} x ^ {2} v''(x)+(r- \ delta)xv'(x) - RV(x),g(x)-v(x)\ rectle \} = 0}

对于所有x∈(0,∞)∖{b} {b} {\ displaystyle x \ In(0,\ infty)\ setMinus \ {b \}}其中b {\ displaystyle b}是练习边界。已知解决方案是[7]

(永久呼叫)v(x)= {(b-k)(x / b)γx∈(0,b)x - k xx∈[b,∞){\ displaystyle v(x)= {\ begin {案例}(bk)(x / b)^ {\ gamma}& x \ in(0,b)\\ x-k& x \在[b,\ infty)\ end {uis}}}其中γ= (ν2+ 2 r - ν)/σ{\ displaystyle \ gamma =({\ sqrt {\ nu ^ {2} + 2r} - \ nu)/ \ sigma}和ν=(r - Δ)/σ - σ/ 2,b =γk /(γ - 1)。 {\ displaystyle \ nu =(r- \ delta)/ \ sigma - \ sigma / 2,\ quad b = \ gamma k /(\ gamma -1)。}

(永恒的)v(x)= {k - xx∈(0,c](k - c)(x / c)γ〜x∈(c,n){\ displaystyle v(x)= {\ begin {案例} K-x& x \ In(0,c] \\(kc)(x / c)^ {\ tilde {\ gamma}}& x \ in(c,\ idty)\结束{is}}其中γ〜= - (ν2+ 2 r +ν)/σ{\ displaystyle {\ tilde {\ gamma}} = - ({\ sqrt {\ nu ^ {2} + 2r} + \ nu)/ \ sigma}和ν=(r - δ)/σ - σ/ 2,c =γ〜k /(γ〜 - 1)。{\ displaystyle \ nu =(r- \ delta)/ \ sigma - \ sigma / 2,\ quad c = {\ tilde {\ gamma}} k /({\ tilde {\ gamma}} - 1)。}

另一方面,当到期日为有限时,问题与2维自由边界问题相关联,没有已知的闭合液解决方案。然而,可以使用各种数值方法。参见Black-Scholes模型#美式估值方法的美式选项,以及基于离散的树的Fugit,计算锻炼的最佳时间。

^ Chow,Y.S;罗宾斯,h ;; Siegmund,D。(1971)。非常期望:最佳停止理论。波士顿:Houghton Mifflin。

^ Hill,Theodore P.(2009)。 "知道什么时候停止"美国科学家。 97:126-133。 DOI:10.1511 / 2009.77.126。 ISSN 1545-2786 - VIA(用于法语翻译,请参阅7月份副出版的封面故事(2009))。

^ a b peskir,goran; Shiryaev,Albert(2006)。 "最佳停止和自由边界问题"数学讲座。 ethzürich。 DOI:10.1007 / 978-3-7643-7390-0。 ISBN 978-3-7643-2419-3。 CITE JOURNG需要|期刊=(帮助)

^Øksendal,b .; Sulem,A. S.(2007)。 "跳跃扩散的应用随机控制" DOI:10.1007 / 978-3-540-69826-5。 ISBN 978-3-540-69825-8。 CITE JOURNG需要|期刊=(帮助)

^ macqueen,j .;米勒Jr.,R.G. (1960)。 "最佳持久性政策"行动调查。 8(3):362-380。 DOI:10.1287 / opre.8.3.362。 ISSN 0030-364x。

^ Karatzas,Ioannis; Shreve,Steven E.(1998)。 "数学融资方法"随机造型和应用概率。 39. DOI:10.1007 / B98840。 ISBN 978-0-387-94839-3。 CITE JOURNG需要|期刊=(帮助)

托马斯S. Ferguson,"谁解决了秘书问题?"统计科学,卷。 4.,282-296,(1989)

F. Thomas Bruss。 "将赔率与一个人和第一个。"概率史,卷。 28,1384-1391,(2000)

F. Thomas Bruss。 "正确决定的艺术:为什么决策者想要了解赔率算法。"欧洲数学社会的时事通讯,第62期,14-20,(2006)

罗杰森,河;秋千,r。 Wright,R。(2005)。 "劳动力市场的搜索 - 理论模型:调查"中国经济文学杂志。 43(4):959-88。 JSTOR 4129380。