Loading...
墨滴

张春成

2021/06/12  阅读:32  主题:默认主题

概然而非必然的世界(之三)

概然而非必然的世界(之三)

本文是针对“概然而非必然的世界(之二)”的数学原理解释和说明。

我将从“二项分布”和“正态分布”的角度,来对以上实验结果进行解释,……并顺理成章地,引出参数估计与统计检验的基本概念。

相信通过本文的论述,我们可能对随机变量的“均值”、“方差”及“均值的方差”这些拗口的概念,具有直观的理解。


二项分布

二项分布是经典分布之一,用来描述重复“伯努利实验”结果时是非常合适的先验分布。 其概率密度函数如下

其中, 分别代表总实验次数和成功实验次数,每次实验成功的概率为 。 究其意义,它代表 次独立重复实验中,有 次实验成功的概率。

由于二次型[1]已经具有丰富的理论成果,我们不加证明地得到以下分析结果

上述三个等式分别说明了这样三件事情:

  1. 我们所声称的概率密度函数确实是概率密度函数;
  2. 若随机变量 服从二项分布,则它的均值
  3. 若随机变量 服从二项分布,则它的方差

其中,均值[2]方差[3]是描述分布特性的重要指标,有着极其明确的实际意义。 这两个指标可以用来对采样值所属的范围进行估计。

估计与范围

当我们假设某个随机变量 服从二项分布,我们有

那么在 值已知的情况下,我们能够合理地认为, 值的取值中心为 ,即该分布的均值。 另外,由于 值为随机变量,它的变化范围由其方差 所决定。

也就是说,随着实验次数的增加, 值的取值中心及取值范围同时扩大。 单纯这样看,我们并不能直接得到某此结论,需要进一步对其进行操作。 操作的方法是进行多次采样,并求其均值。

然而,由于我们已经进行了 次实验,可以自然地将它们看作是多次实验。 这样,我们只需要把随机变量 更换为随机变量 即可。 此时,新随机变量的均值和方差为

这是一个非常有意思的结论,新随机变量的采样值 将严格地收敛到概率值 ,并且它的方差值也随着 值的增加而线性减小。

因此,随着实验次数 的增加,我们可以认为实验成功次数占总实验次数的比例,逐渐收敛于实验成功的先验概率。 将其计为估计值 ,我们可以称其为 值的无偏估计[4]

并且,当 时,其方差收敛于 。 这表明,当实验次数足够大时,我们可以重复这一过程,无论重复多少次,也会得到十分相似的结果,因为这些重复的方差始终为

以上,就是我们常用的“多次实验取平均值”的实验方法背后的统计学原理。

采样、均值与方差

回想在《概希而非必然的世界(之二)》中的游戏实验结果。 我们把它们与“均值和方差”的概念结合起来,就可以轻易地解释这些结果。

通过以上分析可以看出,每轮游戏中,参与者得分与丢分数值的随机变量满足“二项分布”。 根据二项分布的分布特性,随着实验次数 的增加,我们可以看到

  1. 总分持续增加,即 持续增加,代表社会财富持续增加;
  2. 但对每名参与者来说,单个 值的方差 也持续增加,这导致人与人之间无法平等,且随着实验次数的增加,这种不平等会不断加剧;
  3. 新统计量 ,代表社会财富的人均数值,它却不断增长,且不断趋近于真实增长率 ,所以在统计水平上一定会呈现出一种歌舞升平的样子,参与者“被平均”的感觉不可避免地会变得越来越强烈。

到此,本文内容完毕。 但我们遇到了一个新的问题,“用如此简单的数学模型可以作为真实社会经济生活的模拟吗?”我的回答是肯定的。 这涉及数学上的“大数定律”和“中心极限定理”。 将在接下来的文章中,进行阐述。

参考资料

[1]

二次型: https://encyclopediaofmath.org/wiki/Quadratic_form

[2]

均值: https://www.scribbr.com/statistics/mean/

[3]

方差: https://www.scribbr.com/statistics/variance/

[4]

无偏估计: https://mathworld.wolfram.com/UnbiasedEstimator.html

张春成

2021/06/12  阅读:32  主题:默认主题

作者介绍

张春成