Loading...
墨滴

张春成

2021/06/10  阅读:30  主题:默认主题

随机变量与统计检验(一)

随机变量与统计分析(之一)

阿甘正传里有个寓言,说是人生就像一盒巧克力,你永远不知道下一块是什么。 很浪漫地说明了这个世界是概然的而不是必然的,随机和有序是这个世界的基本特征。 因此,随机变量及其统计分析,是解释世界的基本工具之一。


伯努利实验

伯努利实验是经典的思想实验,最简单的,你可以假设盒子里只有两种糖,且数量无限。 实验过程是抽取一颗,记录其种类。 可见,实验结果必为二者取一,其范围固定,且相互排斥。

概率空间

糖果之间数量的比例,构成概率空间。 按照伯努利实验条件,一种糖所占的比例决定了它出现的概率。

概率空间是意念,但每次实验的抽样结果是实在。 在这里,意念是有序的,而抽样是随机的,二者对立统一。

概率密度

在离散情况下,各种实验结果均有其出现的概率,但连续的情况下,所有特定值出现的概率都是

为了解释这种诡异的现象,这里我们改变实验条件,使其平均地(等概率地)取 范围内的实数。 不难发现,满足条件的任意实数均有可能出现。 由于这些实数有无穷多个,因此特定实数出现的概率均为无穷小值。

为了避免这种平凡的零值,我们引入概率密度的思想,尝试用积分解决无穷小量相加的问题。

首先要完成求和到积分的跨越。 我们暂时跳出特定值的困扰,转而求其邻域概率之和;

这样就可以很容易地重新定义其概率密度函数 满足

其中, 代表抽样值出现在特定范围 内的概率。

回到之前的例子,我们不难发现,在概率密度的分析框架下,实验值出现在特定范围内的概率等于其范围占数轴的长度。分析可以分两步进行,

  • 区间分为 份,则每个值出现的概率都是
  • 时,可以使每个元素都唯一地,对应 中的一个数,套用概率密度的分析方法,可知 时,满足概率密度关系式。

因此,才有推论“实验值出现在特定范围内的概率等于其范围占数轴的长度”成立

另外,为了避免这个“长度”的概念过于模糊,我们不妨直接给出它在数学上的定义,即特定集合的“测度”。 不过这已经属于另外一个话题了,我们不再深入。

到此为止,我们还只考虑了最简单的“平均分布”的情况,接下来,我们将引入稍微复杂一些的“正态分布”家族的概率密度函数,由于这些分布不可避免地包含或多或少的参数,如何对这些参数进行估计,就成了统计学中的基本问题之一。

概率密度函数

概率密度函数,即是抽样值与其概率密度之间的映射关系,满足下式即可

数学上,对概率密度的约束也可谓相当宽泛,并不要求它满足可微条件,只需要它的值域为正实数,且求和为 即可。

特殊地,其广义积分

代表其取值小于 的概率,称为累积函数。

张春成

2021/06/10  阅读:30  主题:默认主题

作者介绍

张春成