理解和建模围绕机器学习预测的不确定性对任何生产模型至关重要。它提供了处理模型频串离其适用范畴太远的情况的句柄,进入使用预测的地区是彻底或彻头彻尾的危险。认为医疗诊断或自动驾驶汽车。
为简单起见,我们将考虑以下众所周知的正态分布,但该方法对于任何其他概率分布也是类似的。
设M(x,θ1)\ mu(x,θ1)μ(x,θ1)和σ(x,θ1)\ sigma(x,\ theta_1)σ(x,θ1)是两个子网络具有各自的培训参数Th 1 \ Theta_11 Th 1和Th 2 \Theta_2θ2。
l = 1 2(y - μ(x,θ1)σ(x,θ2))2 + log {2π⋅Σ(x,θ2)}(iii)\标签{iii} \ mathcal {l} = \ frac {1} {2}左(\ frac {y - \ mu(x,\ theta_1)} {\ sigma(x,\ theta_2)} \右)^ 2 + log \,\ left \ {\ ,\ sqrt {2 \ pi} \ cdot \ sigma(x,\ theta_2)\,\右\} l = 2 1(σ(x,θ2)y - μ(x,θ1)) 2 +日志{2π⋅Σ(x,θ2)}
模型 。 eval()ronal_dist = model(x)#使用形状(n,m)的x上的型号均值= normal_dist。均值#检索以形状(n,)std = normal_dist的平均值。 stddev#检索标准偏差(n,)
这种方法很容易和多功能 - 当我需要一个不确定感时,我是我的方法。