Loading...
墨滴

张春成

2021/06/15  阅读:41  主题:默认主题

概然而非必然的世界(之五)

概然而非必然的世界(之五)

本文将续前文《概然而非必然的世界(之四)[1]》。 继续介绍“卡方分布”与“T分布”。


令人纠结的顺序问题

既然是“随笔”,就不妨把我百思不得解的困难,摊开来说一下。 也好使读者和之后的自己,了解当下的困境。 也为可能并不流畅的行文作一些开脱。

目前的困难是这样的

  1. 从逻辑关系来讲,应该先介绍“T分布”,因为它是“正态分布”的小样本解决方案;
  2. 但从数学计算的角度来讲,不先介绍“卡方分布”,就使得“T分布”有如无源之水,难以自洽。

为了避免如此顺序上的尴尬,我们还需要从“正态分布”入手。 通过它的应用困难,分别引出两个重要分布。

万恶之源:样本规模

在上一节中,我们从“二项分布”引出了“正态分布”,并且指出后者是 时的连续性替代。

但实际应用中,我们往往既需要“正态分布”的连续性,又需要应付“小样本”规模的实际情况。 这样不上不下,就很难受。

寻找出路:还是正态分布

我们仔细考察面临的困境,不难发现,虽然我们不能直接认为手中的有限样本服从正态分布。 但是我们有理由认为,它们是从同一个“正态总体[2]”中的有限“独立抽样[3]”。 即

其中, 代表均值和方差为未知常数的正态分布; 代表第 个抽样随机变量。

因为我们自然而然地,获得了如下一系列等式

样本均值的分布:

近似方差的东东:

时,两式的商可以表示为

这就很灵性了,因为让我们头疼的待定方差竟然神奇的消失了。 而让均值等于零的方式也出人意料的简单,我们直接减去样本均值即可。

当然,如果读者您曾经处理过小样本数据的话,对上式应该十分熟悉,因为它活脱脱的就是传说中的“Z分数[4]”变换,即减样本均值除样本标准差的“复杂操作”。 通过变换的命名也不难猜出,它就是“T分布”本T。

卡方分布

这样,我们可以粗暴地给出定义,卡方分布即为下式所服从的分布

其中, ,各个 彼此相互独立, 称为卡方分布的“自由度”。 记为

为了避免影响文章的连续性,我们直接给出卡方分布的概率密度函数为

其中, Gamma函数[5]

其中, 的定义域是复数[6]空间,而“大炮打蚊子”的是,我们只用到实数,甚至整数即可。

T分布

在卡方分布确定之后,我们可以方便地得到T分布的概率密度函数。

首先,给出较为标准的T分布表达式

其中, , 。 记为

同样为了阅读连续性(因为懒),我们直接给出T分布的概率密度函数如下

这样,我们就已经填完了下图中的两个坑,即“卡方分布”和“T分布”。

Tree.png
Tree.png

未完待续

事实上,它们的概率密度函数比较复杂,其证明同样重要,我们将在下篇文章进行介绍。 还将附带Gamma函数的一些好玩的性质。

参考资料

[1]

概然而非必然的世界(之四): http://mp.weixin.qq.com/s?__biz=MzkxNTI1MDc5NA==&mid=2247483914&idx=1&sn=72609edc3197161a25d727a0f56f65f1&chksm=c163490ff614c019abf7f49717edcb3cdf60a1e7b27d3ff2e32b43ab6a483b0972327fb2306d&token=135658256&lang=zh_CN#rd

[2]

正态总体: https://online.stat.psu.edu/stat500/node/510

[3]

独立抽样: https://www.statisticssolutions.com/dissertation-resources/sample-size-calculation-and-sample-size-justification/sampling/?cf_chl_jschl_tk=d6f50f459299af00643a777d69267a620c3cd56a-1623768452-0-AXcpBWbs40Wf3O_bBotoFakj46ifhKo7VWQ1R7ZclcPLyQQDY8OjQ8fa667LycJRW4C1Cg5zEhxpk_o3AvvQetBPUpTVi5gxDb35sr9LzKpyWaPHvfft_g_N8OqfBygybx06tcjREjT69fwG9bTBmOFK-N7xmgLZJiyzIlTDsMJP_W9iSgWfVxUcKIkqzasijtlWxhPpLS_WEk5J94IloygJJdldCkUHPrZCP4RqUe-EroDuch62l8R0NSqo26I0byW2-KyD56ccwgTU9A5rgpjt5r0fcnffAadZkCeGNtj3LLXt1MqJEWfkOleRgr9PlhB8096SNN8KPRUR8zMFZruMYzQtgBqQX7Ru6ZuAwLAkxsDErsV369dDehBCwrEuUqYX8tasC1KwiGi0mpuBuHd38Y_Yu9rginS2XQ9ZBG5fWXMFRTeYmraD4HeQb1RVi57Qesy-2YGiJG3minvMJkD55h8ktr-WUwymVumk6_vT80TtYz1bMguf4Chlm8MaDw

[4]

Z分数: https://www.investopedia.com/terms/z/zscore.asp

[5]

Gamma函数: https://mathworld.wolfram.com/GammaFunction.html

[6]

复数: https://mathworld.wolfram.com/ComplexNumber.html

张春成

2021/06/15  阅读:41  主题:默认主题

作者介绍

张春成