医疗保健实验室的工具、技术和培训

Z-Stats /基本统计

Z-4:均值、标准差和变异系数

当你谈论性病时,不要拘谨,也不要混淆性病和性病。你知道他们说卑鄙是什么意思吗?这些是基本的统计计算。确保你做对了。

EdD助理教授
临床实验室科学计划路易斯维尔大学
路易斯维尔,肯塔基州
1999年6月

本课涵盖的许多术语也可以在本网站上的基本质量控制实践课程中找到。强烈建议您在线或纸质学习这些课程[1]。然而,当前这一教训的重要性在于这个过程。这个教训为以后的教训树立了一个模式。

平均或平均

最简单的统计是平均值。多年前,当实验室开始分析控制时,很容易计算平均值并使用该值作为要实现的“目标”。例如,给定对对照材料进行以下10次分析- 90、91、89、84、88、93、80、90、85、87 - Xbar的平均值为877/10或87.7。(这个词Xbar指在X上有一条线或条的符号,的意思是然而,在这些课程的文本中,我们将使用术语而不是符号,因为它更容易表达。

平均值表示数据的“集中趋势”或“位置”。虽然平均值是最有可能被观察到的值,但许多实际值与平均值不同。在分析对照材料时,很明显,技术人员不会在每次分析对照时都达到平均值。观察到的值将显示出关于平均值的分散或分布,并且需要对这种分布进行表征以设置可接受的控制值范围。

标准偏差

关于平均值的值的分散是可预测的,并且可以通过一系列操作在数学上表征,如下图所示,其中单个x值显示在a列中。

列一个 列B 列C
X值 X value-Xbar (X-Xbar)2
90 90 - 87.7 = 2.30 (2.30)2= 5.29
91 91 - 87.7 = 3.30 (3.30)2= 10.89
89 89 - 87.7 = 1.30 (1.30)2= 1.69
84 84 - 87.7 = -3.70 (-3.70)2= 13.69
88 88 - 87.7 = 0.30 (0.30)2= 0.09
93 93 - 87.7 = 5.30 (5.30)2= 28.09
80 80 - 87.7 = -7.70 (-7.70)2= 59.29
90 90 - 87.7 = 2.30 (2.30)2= 5.29
85 85 - 87.7 = -2.70 (-2.70)2= 7.29
87 87 - 87.7 = -0.70 (-0.70)2= 0.49
X = 877 (X-Xbar) = 0 (X-Xbar)²= 132.10
  • 第一个数学运算是求和。求和符号),并计算平均值,即877除以10,在本例中为87.7。
  • 第二种操作是从每个控制值中减去平均值,如b列所示。这一项以X值- Xbar表示,称为差异分数。从这里可以看出,个体差异得分可以是正的,也可以是负的,差异得分的总和总是零。
  • 第三种操作是对差值进行平方,使所有项都为正,如C列所示。
  • 接下来对平方差分数求和。
  • 最后,可预测的离散度或标准差(SD或s)可以计算如下:


= [132.10/(10-1)]1/2 = 3.83

自由度

上式中的“n-1”项表示自由度(df)。松散地解释,术语“自由度”表示在一组数字中有多少自由度或独立性。例如,如果你要将四个数字相加得到一个总数,你可以自由选择任何你喜欢的数字。然而,如果这四个数字的和被规定为92,那么选择前3个数字是相当自由的(只要它们是小数字),但最后一个选择受到总和必须等于92的条件的限制。例如,如果随机选择的前三个数字是28、18和36,这些数字加起来是82,距离目标还差10。最后一个数字没有选择的自由。必须选数字10才能使总数等于92。因此,自由度被限制为1,只剩下n-1个自由度。在SD公式中,自由度是n - 1,因为数据的平均值已经计算过了(这对数据集施加了一个条件或限制)。

方差

另一个与分布相关的统计术语是方差,即标准差的平方(方差= SD²)。SD的值可能是正的,也可能是负的,因为它是用平方根计算的,可以是正的,也可以是负的。通过SD的平方,消除了符号的问题。方差的一个常见应用是在f检验中使用它来比较两种方法的方差,并确定方法之间的不精确性是否存在统计上显著的差异。

然而,在许多应用中,SD通常是首选的,因为它以与数据相同的浓度单位表示。使用SD,如果方法保持稳定,可以预测应该观察到的控制值的范围。正如前面一课所讨论的,实验室人员经常使用SD对控制值的预期正态分布施加“门”。

正态分布或高斯分布

传统上,在讨论了均值、标准差、自由度和方差之后,下一步是根据标准差“门”来描述正态分布(一个频率多边形)。该图表示通过测量单一对照材料获得的大量实验室值的频率分布。这个分布呈正态曲线的形状。注意,由±1SD组成的“门”占分布的68%或曲线下面积的68%,±2SD占95%,±3SD占>99%。在±2SD处,95%的分布在“门”内,2.5%的分布在下尾或左尾,同样数量的分布(2.5%)出现在上尾。一些作者称这种多边形为误差曲线,以说明来自平均值的小误差比大误差发生得更频繁。其他作者把这条曲线称为概率分布。

变异系数

另一种描述检验变异的方法是计算变异系数(CV)。CV以占均值的百分比表示变化,计算方法如下:

CV% = (SD/Xbar)100

在实验室中,当SD与浓度成比例增加时,CV是首选。例如,来自复制实验的数据可能显示,浓度为100单位时SD为4单位,浓度为200单位时SD为8单位。两种浓度下的CV值均为4.0%,在描述两种浓度之间的方法性能时,CV值比SD值更有用。然而,并不是所有的测试都会证明不精确,这是恒定的CV。对于某些测试,SD在分析范围内可能是恒定的。

CV还提供了关于方法性能的总体“感觉”。5%或更低的cv通常会给我们一种良好的方法性能感觉,而10%或更高的cv则听起来很糟糕。然而,在评判一份简历之前,你应该仔细看它的平均值。在非常低的浓度下,CV可能很高,在高浓度下CV可能很低。例如,胆红素试验的SD值为0.1 mg/dL,平均值为0.5 mg/dL, CV为20%,而浓度为20 mg/dL的SD值为1.0 mg/dL, CV为5.0%。

替代公式

关于基本质量控制实践涵盖这些相同的术语(参见QC -数据计算),但使用不同形式的方程来计算累积或批量均值和标准差。文献指南建议在计算控制限时使用累积均值和标准差[2-4],因此能够进行这些计算是很重要的。

累积平均值可以表示为Xbar = (求和符号xt/ nt,除了“t”下标之外,它看起来与先前的均值项相似,“t”下标指的是来自不同时间段的数据。我们的想法是加入求和符号x从数据组中取n项来计算组合组的均值。
累积或成批至今的标准差可表示为:

这个方程看起来和之前的方程很不一样,但实际上,它是等价的。累积标准偏差公式是从一个叫做原始分数公式的SD公式推导出来的。而不是首先计算平均值或Xbar, Raw Score公式计算平方根符号内的Xbar。

在阅读统计资料时,经常会出现一个不熟悉的公式。你应该认识到统计学中的数学常常是多余的。每个过程都建立在前一个过程的基础上。看起来不同的公式是由你已经熟悉的标准表达式的数学运算推导出来的。

参考文献

  1. Westgard JO, Barry, PL, Quam EF。基本质量控制实践:医疗保健实验室统计质量控制培训。麦迪逊,威斯康辛州:Westgard质量公司,1998。
  2. Westgard JO, Barry PL, Hunt MR, growth, T.临床化学质量控制的多规则Shewhart图。临床化学1981;27:493-501。
  3. 魏嘉德。质量管理。临床化学Tietz教科书第17章,第三版,Burtis和Ashwood编辑。费城,宾夕法尼亚州:桑德斯出版社,1999。
  4. ncls C24-A2文件。定量测量的统计质量控制:原理和定义。国家临床实验室标准委员会,Wayne PA, 1999。

自我评估演习

  1. 手动计算以下数据的均值、SD和CV: 44、47、48、43、48。
  2. 使用SD计算器计算以下数据的均值、标准差和CV: 203、202、204、201、197、200、198、196、206、198、196、192、205、190、207、198、201、195、209、186。
  3. 如果上面的数据是用于胆固醇控制材料,计算控制限度,将包含95%的期望值。
  4. 如果将控制限值(或SD“门”)设置为+/- 2.5 SD的平均值,那么预期超过这些限值的控制值的百分比是多少?[提示:你需要找到一个法向曲线下的面积表。]
  5. 描述如何计算累积控制限值。
  6. (可选)显示常规SD公式与Raw Score公式的等价性。[提示:从常规公式开始,用求和项代替Xbar,两边乘以n/n,然后重新排列。]

作者简介:马德隆·f·扎迪

Madelon F. Zady是路易斯维尔大学联合健康科学学院临床实验室科学项目的助理教授,拥有超过30年的教学经验。她拥有路易斯维尔大学的学士学位、硕士学位和教育学博士学位,并参加了医学院和教育学院的其他高级课程,以及统计学高级课程。她是一名注册MT(ASCP)和一名有资格的CLS(NCA),并作为一名兼职技术员工作了14年。她是美国临床实验室科学学会、肯塔基州临床实验室科学学会、美国教育研究协会和国家科学教师协会的成员。她的教学领域是临床化学和统计学。主要研究领域为元认知和学习理论。

Joomla SEF url由Artio提供