医疗保健实验室的工具、技术和培训

Z-Stats /基本统计

Z-10:方差分析

方差分析。不,这不是PBS的节目,这是方差分析。虽然这是统计学家的激情所在,但对实验室人员来说就没那么令人兴奋了。Zady博士简化了主题,使其更容易理解和实施方差分析在医疗保健情况。

方差分析

EdD,助理教授
路易斯维尔大学临床实验室科学专业
路易斯维尔,肯塔基州
2000年1月

在第9课中,讨论了实验因素对显著性检验的影响,特别是选择α水平和n的大小的困难。当需要比较两种以上的方法时,还有另一个与α水平相关的困难。例如,假设一名研究人员决定测试几种不同水平的抗生素。你能用t检验来比较每个实验组和对照组吗?答案是肯定的,但每进行一次t检验,alpha水平就会增加到0.05以上,这使得判断组间是否存在显著性差异变得更加困难。

你可能更熟悉实验室QC中发生的类似困难,当分析多个对照材料或收集多个对照观察值时。当控制图的控制限设置为正负2个标准差的平均值时,这与alpha水平为0.05的显著性检验相当,即,当分析单个对照材料或收集单个对照观察时,预计会有5%的错误拒收率。如果分析两种不同的材料或收集两个对照测量值,并将两者与2 SD限值进行比较,则误拒率增加到近10%;如果有三种对照材料或三种观察结果,假拒绝率增加到14%左右。实际上,设置为0.05的alpha水平仅适用于显著性检验的单一应用。当不存在差异时,多个应用程序将增加拒绝原假设的机会(即,将导致错误拒绝)。

在本课中,我们将重点关注在两个以上组的实验中显著性检验的应用,并描述保持α水平不变并使用F分布和F检验的统计过程。您可以从韦斯特加德博士的课程中了解更多关于QC申请的信息-被拒绝的机会。

f检验和方差分析

在第二课介绍的组织者中,我们看到,当我们从步骤5 (t检验)移动到步骤6 (f检验)时,我们“去掉了平方根”项。在计算t时,我们总是用误差项除以误差项的平方根。在f检验中,我们不再使用平方根项。F表示t的平方或者F= t²。因此,如果需要t值为2.00(1.96)或更大才能以0.05的概率拒绝原假设,则F值为4具有大致相同的0.05概率。这是近似,因为f分布是非正态分布;对于更精确的值,可以使用f值表。

f检验是方差的度量,我们用它进行方差分析,通常称为ANOVA。回想一下第5课,方差是均值与N的平均值之差的平方和或:

方差=(value-mean)²/ N = SS / N

我们还了解到,SD的计算方法是方差项的平方根(记住,取一个数的1/2次方等于取其平方根)

SD =(方差)1/2= (SS / N)1/2

现在,如果我们不经历取平方根的数学步骤,即我们“去掉平方根”,正如组织者所描述的那样,我们实际上是在处理方差。最简单的方差分析称为单向方差分析,这是我们接下来要考虑的。

单向方差分析

ANOVA是在保持alpha水平的情况下,对几个实验变量(自变量)的方差或一个变量(自变量)上的几个水平进行分析的方法。在方差分析程序中,自变量可以是类别指定或类别(不连续),如抗生素或无抗生素。因变量,如寿命天数被认为是一个度量(连续)变量。在方差分析中,因变量总是一个度量,如天数或测试结果。

将第7课讨论过的抗生素实验进行扩展,假设实验者决定使用三种不同水平的抗生素(仍然是一个分类变量),而不是仅仅使用抗生素或不使用抗生素,看看哪种特定剂量更有效。现在自变量上有三个层次,它们是三组老鼠。1组抗生素水平低;2组中剂量抗生素;第三组抗生素含量高。t检验不能再用了,因为有两个以上的组。这种情况需要最简单的方差分析,即单向方差分析,有时称为单向过程。在上述情况下,三个组或水平的零假设为:Ho:µ地中海

实验结果如图所示。这里我们看到三组分布。低密度分布和中等密度分布比高密度分布更接近。这是否意味着HI显著不同?我们怎样才能得出结论呢?方差分析的目的是显示三组的均值是否存在差异。与我们到目前为止所讨论的其他统计测试一样,这里有一个典型的数学逻辑流程。基本上,我们要确定所有三组的总体均值或大均值,然后判断每个个体均值与大均值的差异有多大。

确定宏大和群体的手段

将生命周期天数的所有值相加,然后对所有组的小鼠数量取平均值,得到总体均值或大均值或Xbar大均值或X通用汽车.为了确定单个组均值,将每个组内的值相加并除以各自的N。在上图中,最高的竖线表示总体均值,分布内的竖线表示个体均值。

划分方差

如何确定群均值是否与总均值不同?现在我们只考虑HI组。在上图中找到HI组的分布。看看在HI分布的右尾部的最高HI分数。该值与GM(总均值)之间的关系由“组内”方差和“组间”方差组成的“总方差”来描述。

  • 总方差描述了均值与HI分布右尾最高HI分数之间的关系,可以估计为= S(X-X)通用汽车²。它可以看作是上图中最长的虚线;
  • 在集团HI组的方差用最高值与HI分布均值之间的虚线表示,可以估计为HI方差= S(X-Xbar)²;
  • 组之间方差用虚线表示,虚线表示HI组的均值与均值之间的距离,可以估计为= S(Xbar)- x通用汽车²。

确定方差的组成部分

到目前为止,我们只与HI集团合作过。我们需要对LO组和MED组进行相同的计算,因为方差成分的最终估计来自所有三个组(即,在我们测试三种抗生素水平的例子中,K=3)。下表提供了单向方差分析计算的摘要。

  • 组之间方差显示在第一行。它的计算方法是,从HI、MED和LO组的组均值(GP)中减去总均值(GM),对差异进行平方,并将它们相加,得到组间的平方和项(SSB)。该SSB项除以K-1,其中K为组数(在本例中为3),以提供方差项,标记为MSB的组间均方根,表示组间方差。
  • 在集团方差显示在表格的第二行。它是由HI组值(例如)在N- k上的平均值(SSW)的平方差和推导出来的,其中N表示每组中的数字。同样,这是一个典型的方差计算,新的术语被称为MSW或均方根,这里指的是HI组。这个术语有时被称为残差或误差平方和(SSE)。
  • 总方差显示在最后一行。与它相关的df等于所有N加在一起减1。这个术语有时被称为SST或TSS或总平方和。

使用f检验比较方差

f检验统计量计算为MSB除以MSW的比率,即Fcalc=MSB/MSW,如上表最右列所示。就像t检验一样,临界f值是从给定df(自由度)的表中找到的。如果Fcalc大于F暴击然后Ho被拒绝,一个或多个组的均值是不同的(这里是HI组)。如果Fcalc小于F暴击然后何站起来。这两组没有显著差异。

计算机程序通常会打印计算出的f值和相关的概率。例如,如果计算出的F值大于4.0,alpha设为0.05,则给出的F概率小于0.05,这表明三组的均值“不相同”。记住,在实验设计中,方法是拒绝零假设(即没有差异的假设)。如果Fcalc小于F暴击,结果将表明不同水平的抗生素具有相同的结果(统计学上),Ho将被保留。假设f概率大于0.05。

注意事项

这篇ANOVA的介绍着重于通过将观察到的总体或总方差划分为组内和组间成分来分析实验组之间差异的概念。所提供的数学是理解应用程序和对解释结果至关重要的统计术语所需的最低要求。

  • 哪一组不同?当实验设计中有两个以上的组时,很难确定哪一组(s)是不同的。在这个例子中,强调了HI组与其他人群或GM之间的差异。请记住,程序方差分析比较所有组意味着检查组间方差和组内方差和存在差异的信号,但它不能告诉哪些组不同。还有其他统计测试,如Tukey和Sheffe测试,可用于确定哪些组是不同的。
  • 观察到的差异的实际意义。在之前的讨论中,我们注意到,如果N足够大,统计检验可能会显示小的差异具有统计显著性,即使这些差异可能没有任何实际意义。在样本量较大的情况下,t检验和F检验都会受到这种影响。
  • 错误的术语。组内方差分量通常称为残差平方和或误差平方和。在某种意义上,群体内的分散或变异构成了误差的来源,因为这种变异的数量将限制实验检测微小变化的能力。我们可以把这个看成除以误差项来找出我们相对于F分布的门的位置。
  • 假设。在大多数统计检验中,有一些基本假设不应该被违背:a)样本必须是随机和独立的;B)分布应该是正态的;c)每组的方差应该相等。统计过程相对于正态分布是稳健的,这意味着违反这个假设可能不是那么有问题。只要每组的N相同,统计过程对不相等方差的影响就最小。
Joomla SEF url由Artio提供