医疗保健实验室的工具、技术和培训

Z-Stats /基本统计

Z-2:统计术语的组织者(第一部分)

扎迪博士介绍了统计学的所有术语。如果你不知道t检验和f检验,这是一个无痛的开始。

EdD助理教授
临床实验室科学计划路易斯维尔大学
路易斯维尔,肯塔基州
1999年4月

第2课和第3课对本系列的其余部分进行了过于简化的描述。这样做是为了帮助学习者学习统计术语和概念。这些课程的目的是作为即将到来的材料的“组织者”。如果你熟悉这些统计术语和概念,你可以快速复习这一课(和第3课),并为第4课(即将到来)中更详细的材料做好准备。

ls32f1在之前的统计学课程中,你可能学过一些重要的术语,比如x的年代,x一横,SD, p, z, t, F, r, a, b,和sres这些概念你还记得多少?也许你从未上过参数统计的正式课程,但在实验室QC工作中,在计算机打印输出中遇到过这些术语。

如果你想掌握统计概念,理解它们是很重要的。通过这种方式,您可以使用它们对您的QC系统进行必要的修改,并了解QC系统方法的未来变化。

第2和第3课为常见的统计术语和概念提供了一个“统计组织者”。在随后的课程中,我们将详细探讨每个概念及其与QC的关系。你不需要做数学练习就能理解这些概念。当你获得视角时,你可能想用一些问题挑战自己,并可以使用可用的计算机程序来执行计算。或者使用本网站提供的工具。

接下来两节课的讨论集中在附图上,我称之为“组织者”,因为它按照学习的顺序排列了统计术语和概念。学习统计学的秘诀之一是要认识到所有这些统计数据都是相关的,并且术语建立在彼此的基础上,如垂直箭头所示。每个新层都建立在前一层的原则之上。

平均数——最常见的统计数字

最简单的术语是平均数或平均数,这是我们社会中几乎每个人都常用的。给定一系列显示波动或变化的数字,对所观察到的情况的最好描述是这些数字的平均值。实验室中的一个例子是对对照材料的一组测量值的平均值计算。平均值是对持续测量所期望的值的最佳估计。这也是你最好的赌注,如果你被要求猜一个数字!

标准偏差-一个常见的实验室统计

下一项是标准偏差,简称SD,大多数实验室人员都很熟悉。在统计QC中,控制限由平均值和SD计算,通常为平均值+/- 2SD或平均值+/- 3SD。当控制限设为平均值+/- 2SD时,预计20个控制测量中有19个将落在限制范围内,因为限制范围涵盖了钟形曲线或正态曲线下95%的区域,如图2所示。当控制限设为平均值+/- 3SD时,预计100个控制测量中有99个应落在控制限内,因为它们占正态曲线下面积的99.7%。

SD是通过分析对照材料的许多等分(至少20份)来确定的,通过将所有这些值相加并除以N(这里是20份)来计算平均值。然后从这些值中减去平均值(控制值-平均值),然后将后一个值平方并对所有20个[?]求和(?)(控制值-平均值)2]。该值除以20-1或19。然后取平方根。这种“值-平均值”(值减去平均值)的说法将是统计学中反复出现的主题。SD的计算将在以后的课程中进行更详细的讲解。(另见QC-The calculation。)

概率或p——统计上的不适常常从这里开始

第三项是概率。当我们讨论SD在质量控制中的使用时,我们声明我们通常希望我们的控制值在对照材料平均值的+/- 2SD范围内运行。+/- 2SD占对照材料平均值周围正态曲线下面积的95%。简单地说,如果控制值落在95%的区域,那么它与平均值没有统计差异的概率为0.95。换句话说,控制值与平均值“相同”的概率为0.95。如果控制值落在这95%的区域之外,落在构成曲线两端的5%的区域内,则控制值在统计上与平均值相同的概率小于0.05。换句话说,控制值与平均值“相同”的概率只有0.05。与正态曲线分布相关的概率将在以后的课程中介绍。

Z-score -一个综合统计

为了理解z分数,我们需要更仔细地观察我们熟悉的标准差。在最初的定义中,SD是用浓度单位来描述的,即对于平均值为200mg /dL的胆固醇控制,SD可以是5mg /dL。2个SDs的控制限为190 ~ 210 mg/dL,或+/- 10 mg/dL。当我们在+/- 2SD的情况下描述控制极限时,我们实际上是在使用标准偏差作为标准分数。标准分数用标准偏差的倍数来表示一个值与对照材料的平均值之间的差异,即该差异中有多少个标准差。所有标准分数中最普遍的是z分数,它用于一些最近的QC分析系统。这个z-score可能会引起混淆,特别是对于在实验室工作了很长时间的分析人员。重要的是要认识到,您多年来一直使用的+/- 2SD标准实际上是一个类似z的分数或标准分数。

z-score的一个非常实际的用途是比较不同的分布,所以你不必关心任何特定的平均值或SD值。假设您正在分析两种不同的对照材料,并希望比较连续测量的结果。现在不是将每个控制值与该控制值的均值进行比较,而是将每个控制值与其均值之差除以其标准差,求出每个值与其各自均值的距离。z值为2.4表示控制值比其平均值高2.4个“标准差”。注意这里产生的z是一个小数。有了z分数,我们不再局限于±1、2或3。还需要注意的是,如果z为2.4,则表明该控制值位于分布的尾部,或者位于曲线的95%区域之外。如果另一个对照材料的下一个观察值的z值为2.1,则有证据表明两个对照都运行得很高,比各自的平均值高出2个“标准差”。请记住,因为z分数是通过将对照材料与其平均值之间的差除以SD来计算的,所以+/- 2z将给出95%的钟形分布或正态分布下的面积。

您还可以使用z分数来比较给定对照材料上观察到的月平均值与前几个月观察到的平均值。在这种比较中,您将使用从每月平均值计算的SD(通常称为平均值的标准误差)。就像以前一样,如果当月的平均值落在月均值分布平均值的±2sd内,那么它就落在曲线下95%的区域内,并且有0.95的概率认为当月的平均值与前几个月的平均值“相同”。如果当前均值大于先验均值的2sd(或在分布的尾部),那么当前均值与先验均值相同的概率只有0.05。请注意,虽然实验室人员在这里经常使用术语SD作为标准分数或z类术语,但它实际上是最常用于产生z分数的平均值的标准误差。这些误差项和均值抽样分布将在以后的课程中讨论。

t检验——均值之间差异的显著性

对t值的理解来自于看前面的项。z分数有自己的钟形分布,基于大量人口的平均值(μ或mu)和标准差(s或sigma)。(希腊符号用于描述大总体的参数,而从这些总体的样本中计算的统计数据则使用常规的字母惯例。)为了确定和使用z分数,必须知道整个总体的mu和sigma,这在实际应用中通常是不可能的。幸运的是,当样本量相对较小时,还有另一类类似z的分数,称为t值,其分布接近正态分布。总体均值和不需要知道就可以使用这些t分布,解释是一样的。

例如,当月平均值减去上月平均值的差值可以除以一个误差项,如SD,以计算平均值之间的SD的倍数。现在得到的数字称为t值。如果当前的平均值在前一个月的平均值的±2ts范围内,那么它位于95%的区域,或者它与前一个月的平均值“相同”的概率为0.95。如果当前平均值位于尾部5%的区域,那么平均值“相同”的概率为0.05或更小。

作为一个示例应用,当研究人员试图证明一组接受治疗的动物比一组未接受治疗的对照组动物的平均寿命更长时,t值就被用于实验设计中。这两组的平均寿命将通过t统计量进行比较。t值也用于方法验证,特别是在方法实验的比较中,以评估仪器A和仪器b上获得的分析物的平均值是否相同。更多内容将在后面的课程中介绍。

f检验-一种显著性检验,去掉平方根

从组织器中的第二个统计量开始- SD,我们已经处理了涉及平方根的项。所有这些误差项都是通过取观测值减去平均值,对差项进行平方,加上平方项,除以N,最后提取平方根来计算的。标准差、z分数和t检验都包含一个平方根项。下一个概念F不使用其误差项的平方根,这一重要事实在组织者中已注明。有时统计设计可以使用t或F统计量。结果和结论将不一样,除非你意识到F = t2或t = (F)1/2

关键是t和F是相关的。然而,当你试图根据另一个分布测试多个平均值时,F是对t的改进。例如,如果研究人员试图测试四种不同水平的抗生素的有效性,以确定哪种抗生素最有效,或者如果实验室人员使用三种不同的筛选仪器测试分析物上获得的平均值,则F比t更可取。在第一个例子中,至少可以执行四次t检验,在后一个例子中至少可以执行三次t检验。然而,这些统计测试的结果可能会成为一个问题。我们将此问题称为类型I错误,稍后将介绍。f检验,通常被称为ANOVA(或其他OVA检验),可以控制这些实验设计或方法比较中引入的统计误差。通常这些测试是计算机化的,但解释遵循我们上面看到的相同的一般模式。F有自己的分布。如果F结果在“+/- 4f”范围内,则这些值位于F分布的95%区域内,并且有0.95的概率平均值都是“相同的”。 If the F result is greater than "+/- 4Fs" then the value(s) lie in the tails of the F-distribution, and there is only a 0.05 probability or less that the means are "the same." More will be said in a later lesson.

主办单位评审

当我们浏览上面讨论的统计概念时,我们看到每个后续的级别都是建立在前一个级别之上的。平均值是起点,描述了一个值最有可能出现的位置。标准偏差提供了关于平均值分布的附加信息。知道均值和标准差可以推断出某些事件发生的概率。这些概率也与“标准分数”有关,“标准分数”描述了值在正态分布中的相对位置。你可以把标准分数想象成正态分布上的一个“门”。标准分数为+/- 2的门围成曲线下95%的面积。如果一个新值落在这个区域内,那么它与分布的平均值“相同”的概率为0.95。如果该值落在包含尾部的5%区域内,则它与分布的平均值“相同”的概率为0.05或更小。z分数是标准分数的常用统计形式。 t-values provide a more practical form for testing the difference between two mean values. F-values are related to t-values (remember by dropping the square root) and permit testing the differences between multiple means or averages.

不要让这些统计数字压垮你。“组织者”将帮助保持它们的正确性,并帮助您学习术语和理解术语是如何相互构建的。下一课将考虑统计关系,并将组织者扩展到相关和回归。

传记:马德隆·f·扎迪

Madelon F. Zady是路易斯维尔大学联合健康科学学院临床实验室科学项目的助理教授,拥有超过30年的教学经验。她拥有路易斯维尔大学的学士学位、硕士学位和教育学博士学位,并参加了医学院和教育学院的其他高级课程,以及统计学高级课程。她是一名注册MT(ASCP)和一名有资格的CLS(NCA),并作为一名兼职技术员工作了14年。她是美国临床实验室科学学会、肯塔基州临床实验室科学学会、美国教育研究协会和国家科学教师协会的成员。她的教学领域是临床化学和统计学。主要研究领域为元认知和学习理论。

Joomla SEF url由Artio提供