医疗保健实验室的工具、技术和培训

Z-Stats /基本统计

Z-11:置信区间

你有多相信你实验室的数据?有一种统计方法可以确定到底有多少。

EdD,助理教授
路易斯维尔大学临床实验室科学专业
路易斯维尔,肯塔基州
2000年7月

我们之前在第7课中关于置信区间(CI)的讨论有些过于简化了。虽然我们充分解决了在临床实验室QC程序中使用置信区间的目的,但理论覆盖率很低。本节旨在将实践和理论结合起来,但是一些概念化将继续未经检查,因为它们超出了这些课程的范围。

回顾CI在假设检验中的应用

回顾之前的小鼠-抗生素实验,95%置信区间表示为:

CI =对照组均值±(t)暴击)(年代Xbar

其中t暴击alpha值为0.05时为1.96或约为2.00和sXbar是第5课中提到的平均值或SE的标准误差。在这种情况下,对照组的平均值被当作总体平均值来使用。这个CI公式基本上在对照组平均值周围的曲线上设置了±2t的区间。该公式还将t值重新膨胀为一个“集中”值,这里是寿命天数。进一步说明,如果新平均值落入该CI或寿命天数,我们可以接受任何新实验组的平均值与对照平均值“相同”。

CI在参数估计中的应用

事实证明,有几种方法可以观察置信区间。CI有不同的含义,这取决于它们是用于假设检验(如上所述)还是用于参数估计(如估计总体均值)。因为我们已经看了假设检验,下面是参数估计的一个例子。

假设总体均值是未知的,但被推测或假设为某个数字。从mu未知的总体中抽取一个N的简单样本。计算该样本的平均值,得到Xbar,以及误差项,如SE或sXbar.由于总体的均值是未知的,所以总体样本的均值是总体均值的最佳单点估计量。CI是使用上面的95%置信区间公式在这个Xbar周围设置的。记住,这个置信区间是围绕样本统计量或单个样本均值设置的,而不是围绕总体参数设置的。在这种情况下,解释是有95%的置信度mu或总体均值位于单样本均值附近的区间内。

推理链如下:

  • 假设总体的均值,例如mu = 100。零假设变成Xbar - 100 = 0。
  • 绘制一个样本并计算平均值或Xbar。
  • 进行t检验,看看Ho可以被推翻。
  • 如果Ho,用下式建立样本均值周围的置信区间:CI =样本均值±(t暴击)(年代Xbar
  • 如果期望95%置信区间为t暴击= 1.96。95% CI仅代表正态曲线分布下95%的面积,其中5%的面积位于两个尾部。假设确定的值最低为86,最高为114。总体均值在这个区间内有95%的置信度。

理论抽样分布和中心极限定理

很明显,在上述计算中,机会将起很大的作用。如果从上述总体中取出另一个样本,则很可能会得到一个完全不同的Xbar。Xbar会影响95%置信区间的上限和下限。如果抽取5个不同的样本,每个样本可能有不同的xbar和不同的CI,如图所示。“真实的”或推测的总体均值存在于这些区间内的概率为95%。

当然,总体中可能的样本不止5个。记得在第五课中,当我们试图确定均值的标准误差时,我们抽取了12个样本。然后我们讨论了均值的抽样分布它包含了所有可能的样本均值。为了增加获得总体真实均值的机会,所有可能的样本均值和置信区间必须确定。这可能需要花费大量的精力和时间。

幸运的是,这是不必要的。统计学家使用的是由数学定理定义的理论抽样分布。这些定理提供了有关这些分布的形状、集中趋势和变化的信息。均值抽样分布的形状由中心极限定理.中心极限定理告诉我们,随着N的增大,均值的抽样分布近似于正态曲线。即使采集样本的分布不是正态分布,这种情况也会发生!无论如何,它们的均值都是正态分布。(该定理也适用于均值和其他统计数据的差异。)

这对我们这些习惯将门限放在正态分布上的人来说是一个巨大的福音。如果我们坚持均值的抽样分布,标准误差项和中心极限定理,我们总是可以使用±1.96门。所有可能的样本均值及其随后的正态曲线分布或中心极限定理的计算意味着,理论上该总体中95%的样本均值位于真实总体均值的±1.96标准误差范围内,并且同样类型的泛化将适用于它们的置信区间。记住,抽样分布总是正态分布。

在假设检验中,对于已知的总体均值,也使用中心极限定理和理论分布。当Ho被拒绝,则预计样本均值不会位于总体均值周围的置信区间内。当Ho保留,则样本均值预计位于该置信区间内。

在方法实验的实验室比较中,我们可以继续考虑在原检验程序均值周围设置95%置信区间,以确定新的检验程序均值是否在该区间内。然而,我们应该提醒自己,我们假设原始过程的均值是总体的mu。我们必须承认,我们正在研究一个理论上的抽样分布。

零附近的置信区间

如果我们真的希望在统计上是正确的,我们还必须意识到我们正在处理的是差异在的意思。在第8课中,我们纠正了一些关于统计学的想法两个示例案例.在本课的第一部分中,我们讨论了一种方法的均值和总体均值之间的区别。实际上,当我们考虑比较方法均值时,我们讨论的是两个样本均值之间的差异以及它们与自身总体均值的差异。即有两个样本X和Y,这两个样本分别来自它们各自的总体X和Y。我们需要考虑用样本均值之差减去总体均值之差,即[(样本均值Y-样本均值X) - (mu Y-mu X)]。

t的公式calc我们在第8课中使用的是均数差公式:

零假设为:(XbarY - XbarX) -(µY -µX) = 0。

然后我们假设(µY -µX)的差为零,因此公式为:

零假设是(XbarX - XbarX) - 0 = 0。

下图显示了均值之差的理论抽样分布。利用这个定理抽样分布均值之差是正态分布,均值为0。如果tcalc对于这条曲线上95%门内的任何一组均值的差异,则认为均值是“相同的”。现在我们的方法比较剩下的就是看看方法均值之间的差是否为零,并且Ho将被保留。我们也可以走捷径,如果零位于方法均值之差的置信区间内,那么我们可以接受它们的差为零。CI的公式似乎很熟悉:

CI = (xbarx - xbarx)±(t暴击) (SDd)

如果选择Y和X的样本并确定其均值之差,则95%置信区间可以如图2的抽样分布所示。由于95%置信区间包含数字0,因此不能推翻无差异的原假设。测试程序被认为给出了类似的结果。

如果结果如下图3所示,则CI不包含假设值零。显然,零假设必须被拒绝。两种分布的均值有显著差异

总结与回顾

现在让我们回过头来看看我们学到了什么。在前一课中,我们学习了如何使用公式设置置信区间:

CI =对照组均值±(t)暴击)(年代Xbar

我们声明,如果任何未来的平均值在这个CI中下降,那么它将被认为在统计上与对照组平均值“相同”。在这节课中,我们了解到这只是两种看待CI的方法之一,即假设检验。

另一种观察或使用CI的方法是从样本均值估计总体均值。首先,我们推测总体的平均值,例如,这里是100。然后,我们完成了该过程的其余步骤,并获得了围绕样本均值建立的CI。我们有95%的置信度总体均值在这个区间内。当我们意识到我们可以绘制几个不同的样本并得出几个不同的CI时,我们放弃了这个立场。总体的平均值几乎可以表示为任何数字。

幸运的是,统计学家已经解决了这个问题,并开发了理论上的抽样分布。中心极限定理告诉我们,给定足够大的N,均值的抽样分布总是正态分布,即使计算均值的总体本身不是正态分布!每次我们检验一个假设时,我们都会利用这个定理。

在报道的最后一部分,我们承认,当我们进行方法比较(和其他一些统计程序)时,我们不仅仅是将样本均值与总体均值进行比较,或者不仅仅是从样本均值中减去总体。我们用两种方法的样本均值之差减去两种方法的总体均值之差。理论推导的均值之差的抽样分布的均值为零。如果样本均值之差为零,则接受均值无差的零假设。两种方法比较具有优势(p>0.05)。或者我们可以走捷径,说零包含在均值之差周围的95% CI中。

Joomla SEF url由Artio提供