医疗保健实验室的工具、技术和培训

Z-Stats /基本统计

Z-3:统计术语的编纂者(第二部分)

Madelon F. Zady博士谈到了关系的本质(相关性)和关系的强度(回归)。当然,这些都是统计关系。对于其他形式的关系建议,我们建议您完全咨询网站管理员或其他网站。

EdD助理教授
临床实验室科学计划路易斯维尔大学
路易斯维尔,肯塔基州
1999年5月

第2课和第3课对本系列的其余部分进行了过于简化的描述。这样做是为了帮助学习者学习统计术语和概念。这些课程的目的是作为即将到来的材料的“组织者”。如果你熟悉这些统计术语和概念,你可以快速复习这一课和第3课,并为第4课更详细的材料做好准备(即将到来)。

快速复习第二课

第二课介绍了这个“组织者”。第一项——均值和标准差——是实验室人员所熟悉的,特别是使用均值+/- 2SD作为统计质量控制的控制限(请注意,然而,这些可能不是最好的控制限)。通过熟悉列维-詹宁斯图,大多数实验室人员也认识到这些+/- 2SD限制或“门”在正态曲线或高斯曲线下占95%的面积。该区域也代表0.95的概率,将最后5%的区域(或0.05)留给正态曲线的外部尾部。

实验室人员经常使用+/- 2SD作为标准分数。最常见的标准分数是z分数,它是观测值减去平均值除以标准差的差值。+2到-2的z值对应于曲线下95%的面积,或0.95的概率。在+/- 2中找到的值与分布的平均值“相同”的概率为0.95。

要使用z分布,必须知道总体的真实均值(mu)和真实标准差(sigma)。通常这些是不可用的,因此,考虑一个有足够大的N来近似正态分布的t分布是有用的。t值的解释方式与z分数相同。+/- 2t的“闸门”围合了t分布下95%的面积。t检验可用于方法比较实验,以检验两种方法是否“相同”,在这种情况下,没有证据表明方法或分析器之间存在系统误差。

如果我们想在三个不同的分析器上测试结果的相似性,该怎么办?做多个t检验有一个问题,因此使用f统计量是一个更好的检验。这就是计算改变的地方,我们“去掉平方根”。因为根号F=t2(和F1/2=t),因此f分布上使用的“门”将具有不同的数字,使得“+/- 4F”包含95%的面积。落在这个区间内的值与分布的平均值“相同”的概率为0.95 (p=0.95)。超出这些门的值与分布的平均值“相同”的概率只有0.05 (p=0.05)或更少,因此我们经常得出这样的值是不同的或“统计显著”的结论。

相关性——关系的强度

现在我们转向描述关系的其他统计数据。“组织者”的第七个主题是相关性。相关性是一种表达关系的方式(仅此而已)。相关性所需的数学很重要,主要是因为这些公式与回归上更强大的统计数据相关的方式。我们将在以后的课程中学习相关公式,但是,不要太担心这些方程,因为我们可以使用可用的统计程序来执行这些计算。相关系数设置在r尺度上,范围从+1.00到-1.00。A +1.00表示一个完美的正相关关系,即随着A的增加,B也总是增加。A -1.00表示一个完美的反比关系,即随着A的增加,B总是减少。相关系数接近于0.00表示A和B之间根本没有关系,即点只是随机分散。

相关性计算通常用于方法比较实验的数据,其中一系列样本由两种不同的方法或仪器分析。如果相关结果接近+1.00,则可以认为这些方法具有可比性。相关性的问题在于,它不是很强大,也不是很有信息量。数据的范围和测量的次数都会影响观察到的相关性。事实上,到目前为止,N的大小对所有统计数据都有很大的影响。

回归——关系的本质

组织者的最后一项是回归。回归是一种统计过程,旨在显示两个(甚至更多)变量之间的线性关系。该过程基于直线的数学方程,这在代数入门课程中有介绍:y = mx + b或y = bx + a。请注意,这两组符号将在文献中遇到,因此您需要识别正在使用的符号。同样,术语的顺序可能会以不同的方式呈现,例如,y = a + bx(这就是它们在本网站的方法验证课程中出现的方式)。

与相关性一样,回归也可用于显示x和y变量之间的关系,以及预测对应于临界x值的y值。例如,在方法比较实验中,我们有兴趣了解方法之间的系统误差,系统误差可以通过计算出的y值与代表关键医疗决策水平的x值之间的差来估计。在随后的一课中,为了演示过程回归的许多优势,将对这个公式进行操作。

在y = a + bx方程中,a称为y截距,b称为斜率。y和x的完美关系应该是截距为0,斜率为1。这种关系的曲线图我们很熟悉,它是一条直线,与曲底成45度角,经过零点(y=0,x=0),如图所示。

这种“比较图”通常用于显示方法比较实验的数据,其中一组标本(通常为40个或更多)通过一种新的或测试方法和一种既定的方法或比较方法进行测量。理想情况下,数据应该显示45度角和零截距的直线关系。这种一对一的线性关系的斜率为1。A增加一个单位,B也应该增加一个单位。统计计算机程序可用于执行这些计算,显示斜率和截距值,并提供数据的图。[例如,请参阅配对数据计算器,它是本网站提供的互联网工具的一部分。]

相关性与回归

相关统计和回归统计通常是为预期显示线性关系的数据集计算的,例如,在方法比较研究中,有兴趣知道从新方法或仪器获得的值与从旧方法或仪器获得的值之间的关系。接近+1.00的相关系数表明,随着x的增加,y也随之增加。然而,确切的增加量并不清楚,例如,x的5个单位的变化可能对应于y的10个单位的变化。为了准确描述y随x变化的变化量,我们需要知道回归统计量——斜率和y截距。然后,使用直线方程(y = a + bx),我们可以计算任意选定x值的期望y值。因此,回归是一种比相关性有用得多的统计工具,因为它允许您预测对应于所选x值的确切y值。

总结

第2课和第3课以及“组织者”图形可用作指南或地图。当你继续学习课程时,回顾这些材料,尤其是组织者的形象,应该是有帮助的。组织者不仅会告诉你课程的组织,还会告诉你不同统计数据之间的关系。它将帮助你监控你在整个课程中的进展和你一路上的理解。它向您展示了如何组织统计数据并获得对概念的控制权。这些功能将帮助您在将来将统计应用于实际数据和实际问题。

作者简介:马德隆·f·扎迪

Madelon F. Zady是路易斯维尔大学联合健康科学学院临床实验室科学项目的助理教授,拥有超过30年的教学经验。她拥有路易斯维尔大学的学士学位、硕士学位和教育学博士学位,并参加了医学院和教育学院的其他高级课程,以及统计学高级课程。她是一名注册MT(ASCP)和一名有资格的CLS(NCA),并作为一名兼职技术员工作了14年。她是美国临床实验室科学学会、肯塔基州临床实验室科学学会、美国教育研究协会和国家科学教师协会的成员。她的教学领域是临床化学和统计学。主要研究领域为元认知和学习理论。

Joomla SEF url由Artio提供