医疗保健实验室的工具、技术和培训

Z-Stats /基本统计

Z-8:双样本和定向假设检验

本课描述了对上一课中介绍的假设检验方法的一些改进。问题的真相是,为了关注假设检验过程中的概念和一般步骤,前一课有些过于简化了。有了这个背景,我们现在可以进入假设检验的一些细节。

EdD,助理教授
路易斯维尔大学临床实验室科学专业
路易斯维尔,肯塔基州
1999年10月

本课描述了对上一课中介绍的假设检验方法的一些改进。问题的真相是,为了关注假设检验过程中的概念和一般步骤,前一课有些过于简化了。有了这个背景,我们现在可以进入假设检验的一些细节。

两个示例案例

“两个例子”是一种特殊情况两个样本均值之差是检查。这听起来和我们上节课做的很像,但我们实际上看的是观察组或样本组均值和对照组均值之间的差异,这被视为总体均值(而不是观察组或样本均值)。关于计算和程序,有一些细微之处需要考虑。

计算的改进

在数学上,应该使用的公式有一些不同之处。回想一下计算t值的方程形式:

其中Xbar为实验组的平均值,µ为总体参数或总体的平均值。在上一课中,我们用对照组平均值XbarB代替µ。然而,对照组实际上是所有这些小鼠群体中的一个样本(在这个例子中),同样,实验组也只是其群体中的一个样本。以这种方式表述情况,现在必须考虑两组差异:样本均值之间的差异(XbarA-XbarB)和这些样本来自的总体均值之间的差异(µA-µB)。这些表达式应该被替换成tcalc公式给出适当的数学形式:

  • 在这个新方程中,平均值(Xbar A - XbarB)之间的差称为偏差,它对确定测试精度很重要,因此,尽管这个讨论变得越来越复杂,但我们推导的统计量非常重要。
  • 新的误差项称为总体方差的汇总估计,由两个样本的差异得分得出,如下:
    在给定一定n的情况下,两个均值之差的分布近似于正态分布,见图8-1。

  • 在汇总方差的表达式中,XAs表示测试a的单个值或分数。从XAs中减去取值的样本的平均值(XbarA),得到一个差分。总和()为整个A值样本的差值的平方。样本b也是如此,差值取N的平均值。分母上的- 2表示损失了2个df,每组一个。
  • 因为这个表达式(XAs-XbarA)的平方为A的差值平方和(SS),可将公式改为:

  • 当取平方根时,结果称为均值之差的标准差SDd,由公式表示:

  • 计算双样本情况下t值的适当方程为:

程序的改进

记住检验假设的步骤是:(1)陈述假设;(2)设定拒绝Ho的标准;(3)计算检验统计量;(4)决定Ho。

  • 零假设可以表示为:Ho:µA =µB或µA -µB = 0。但如果说Ho:(XbarA-XbarB) -(µA -µB) = 0,可能更能说明问题。样本均值之差减去总体均值之差等于零。
  • 备择假设可以表述为:Ha:µA不等于µB或Ha: (XbarA-XbarB) -(µA -µB)不等于0,即两组的均值不相等。
  • 排斥或α水平的标准为0.05。

4

  • 检验统计量计算为:
  • 由于假设两种方法具有可比性,且两总体均值之差为零(µA -µB = 0),计算可简化如下:

  • 如果这个tcalc大于1.96则可以推翻无差异的原假设(p0.05)。
  • 虽然我们用了几个不同的数学公式,但解释都是一样的。

定向假设检验与非定向检验

还记得第7课中测试抗生素对老鼠的影响的例子吗?这项研究的目的是要弄清楚接受抗生素治疗的老鼠是否会比没有接受治疗的老鼠(即对照组)活得更长。研究人员没有假设对照组可能比治疗组活得更长,你感到惊讶吗?假设检验的方式会有什么不同吗?这些问题引出了定向测试,或单侧测试与双侧测试的问题。

对我们的老鼠进行双尾试验

现在不要感到困惑——我们不是在测试我们的老鼠是否有两条尾巴!我们检验的是样本组的平均值是否小于或大于对照组的平均值,这在统计学上被认为是双向或双尾检验。记住,假设是Ho:XbarA = XbarB和Ha: XbarA不等于XbarB。在这个替代假设中,我们所说的只是两个平均值不相同,如果(a)样本组的平均值高于对照组的平均值,或者(b)样本组的平均值低于对照组的平均值,这将是正确的。假设的措辞中并没有规定A组动物(接受治疗)一定比B组动物寿命更长。

在选择临界t值时,双面检验与单面检验的问题变得很重要。在这个例子的前面的讨论中,alpha水平被设置为0.05,但是这个0.05实际上是在分布曲线的左右两端平均分配的。测试的条件是A组的寿命与B组“不同”,这是双尾检验,如图8-2所示。

对我们的老鼠进行的单侧试验

如果结论支持抗生素延长A组寿命的说法,那么研究人员应该使用一个方向替代假设,例如Ha: XbarA > XbarB。这里假设A组的寿命比B组(对照组)更长。在这种情况下,alpha水平为0.05意味着所有0.05都必须出现在曲线的右尾或高尾,这是一个单尾或定向测试,如图8-3所示。该图显示,单尾检验的临界t值实际上会更小,即+1.65,而不是双尾检验的1.96或2.00。之所以会出现这种情况,是因为曲线下95%的面积开始从曲线的最左侧(包括尾部)积累,而曲线右侧的面积较少。结果是tcalc可以更小(1.65而不是1.96),仍然会导致Ho被拒绝。

单侧检验和双侧检验的临界t值

这可能令人困惑,但考虑在曲线上设置一个或两个门应该是有帮助的。例如,对于alpha水平为0.05和双尾检验,有两个门-一个在-1.96,一个在+1.96。如果你“走出”了这两个门中的任何一个,那么你已经证明了p=0.05或更小的显著性。对于单尾测试,在+1.65处只有一个门。如果你“走出”这扇门,你已经证明了p=0.05或更小的显著性。

t表提供单侧和双侧测试,分别列出t暴击。与所有t检验一样,为了拒绝Ho而接受Ha(即A组寿命比B组长),计算出的t必须大于表中找到的临界值。但是在单尾检验中,tcrit是1.65而不是1.96,所以当拒绝Ho时,tcrit也可能更小。使用单尾t检验实际上更容易拒绝Ho。图8-4将这两张图叠加在一起,以演示最后一个语句。
例如,给定表t值(tcrit)为1.96,双尾t检验的显著性为0.05calc1.90时,Ho不能被拒绝。我们只差0.06秒就走出校门了。使用单尾检验,t的值相同calc对于0.05 alpha水平,超过1.65临界值,因此Ho可以被拒绝。我们已经走出大门,站在外面0.25英尺的地方。所以t暴击在相当的α水平下,单尾检验比双尾检验要小。也就是说,用更少的计算t来推翻Ho。该关系如图8-4所示。还有一个更有趣的观点。这个图实际上表明,如果你用t暴击在单尾测试中,1.96的alpha水平实际上会下降到之前的一半,从0.05降至0.025!

重申一下,如果你正站在双尾测试的门口(1.96),那么你刚刚满足了p=0.05的要求。然而,如果你在运行单尾测试时站在1.96点,那么你已经超过了1.65门槛,并且概率必须更加显著,例如p=0.025。重要的是要找到对测试的预期方向性质正确的临界t值。

作者简介:马德隆·f·扎迪

Madelon F. Zady是路易斯维尔大学联合健康科学学院临床实验室科学项目的助理教授,拥有超过30年的教学经验。她拥有路易斯维尔大学的学士学位、硕士学位和教育学博士学位,并参加了医学院和教育学院的其他高级课程,以及统计学高级课程。她是一名注册MT(ASCP)和一名有资格的CLS(NCA),并作为一名兼职技术员工作了14年。她是美国临床实验室科学学会、肯塔基州临床实验室科学学会、美国教育研究协会和国家科学教师协会的成员。她的教学领域是临床化学和统计学。主要研究领域为元认知和学习理论。

Joomla SEF url由Artio提供