医疗保健实验室的工具、技术和培训

基本方法验证

方法与实验的比较

方法实验的比较对于评估真实患者标本发生的系统误差至关重要。提供了进行实验的指导方针,并介绍了如何绘制数据图表以及应该计算哪些统计数据。

注意:这个教训是从……中得出的第一个的版本基本方法验证书。这本参考手册现在已经出版了第三版。该材料的更新版本也可在一个在线培训项目同时获得AACC和ASCLS认证。

目的

通过对几种方法的比较实验来估计误差或系统误差。审查MV -实验计划看看这个实验是如何与其他实验相结合的。您通过使用新方法(测试方法)和比较方法分析患者样本来执行此实验,然后根据两种方法之间观察到的差异估计系统误差。关键医疗决策集中的系统差异是我们感兴趣的错误。但是,关于系统误差的恒定或比例性质的信息也是有用的,并且通常可以从适当的统计计算中获得。实验设计和统计计算对于获得可靠的系统误差估计至关重要。

需要考虑的因素

比较方法

用于比较的分析方法必须仔细选择,因为对实验结果的解释将取决于对比较方法的结果的正确性所能作出的假设。在可能的情况下,应该为比较方法选择一种“参考方法”。该术语具有特定的含义,指通过与精确的“确定方法”和/或通过标准参考物质的可追溯性进行比较研究而知道其结果是正确的高质量方法。测试方法和参考方法之间的任何差异都归因于测试方法,也就是说,错误归因于测试方法,因为参考方法的正确性被很好地记录下来了。

术语“比较方法”是一个更通用的术语,并不意味着该方法的正确性已被记录。大多数常规实验室方法属于后一类。测试方法和常规方法之间的任何差异都必须仔细解释。如果差异很小,则两种方法具有相同的相对精度。如果差异很大且医学上不可接受,则有必要确定哪种方法是不准确的。恢复和干扰实验可以用来提供这些额外的信息。

患者标本数量

两种方法至少需要检测40个不同的患者标本[1]。这些标本的选择应涵盖该方法的整个工作范围,并应代表该方法常规应用中预期的疾病范围。测试样本的实际数量不如这些样本的质量重要。根据观察到的浓度精心挑选的20个标本可能比实验室随机收到的100个标本提供更好的信息。实验的质量和系统误差的估计将更多地取决于获得广泛的测试结果,而不是大量的测试结果。

大数的主要优点是可以识别由于单个样本矩阵中的干扰而导致结果不一致的单个患者样本。当新方法使用不同的化学反应或不同的测量原理时,这通常是令人感兴趣的。建议使用大量标本(100到200个)来评估新方法的特异性是否与比较方法相似。

单次与重复测量

通常的做法是用试验和比较的方法单独分析每个试样。然而,在任何可能的情况下进行重复测量是有好处的。理想情况下,这些重复应该是在不同的运行中分析的两个不同的样品(或杯子),或者至少以不同的顺序(而不是在同一杯子的样品上背靠背地重复)。这些副本可以检查单个方法测量的有效性,并有助于识别由样品混淆、换位错误和其他错误引起的问题。一两个这样的错误可能会对实验得出的结论产生重大影响。至少,这样的错误会在决定差异结果是否代表方法的性能,或者它们是否是应该从数据集中删除的“异常值”时引起很大的恐慌。重复分析将证明这些观察到的差异是否可重复。

如果没有进行重复,那么在收集比较结果时检查比较结果是至关重要的,确定差异较大的样本,并在样本仍然可用时重复这些分析。

时间

应包括在不同日期的不同分析运行,以尽量减少在单个运行中可能发生的任何系统错误。建议试验时间至少为5天[1],但最好延长试验时间。由于长期复制研究可能会延长20天,因此比较研究可能会覆盖类似的时间,并且每天只需要2至5个患者标本。

样品的稳定性

一般情况下,试样应在两个小时内通过试验和比较的方法进行分析[1],除非已知试样的稳定性较短,如氨、乳酸。通过添加防腐剂、将血清或血浆与细胞分离、冷藏或冷冻,可以提高某些试验的稳定性。在开始比较方法研究之前,标本处理需要仔细定义和系统化。否则,观察到的差异可能是由于处理标本的变量,而不是实验目的的系统分析误差。

数据分析

这就是事情变得棘手的地方!从方法对比实验中分析数据的正确方法有很多争论和讨论[2]。自从我成为一名临床化学家以来,这个问题就一直存在,似乎是每一代新一代实验室科学家都会遇到的一个慢性问题。大约25年前,我们研究了方法比较研究中统计学的使用和解释[3,4],我们学到的经验教训今天仍然适用。我们在这里的目的是提供一些简短的指导方针,然后在本系列的后面更详细地讨论统计数据。

绘制数据图

最基本的数据分析技术是将比较结果绘制成图表,并直观地检查数据。理想情况下,这应该在收集数据时进行,以便识别会使数据分析复杂化的差异结果。任何在试验方法和比较方法之间有差异的患者标本应重新分析,以确认差异是真实的,而不是记录值的错误或标本的混淆。

如果期望这两种方法显示出一对一的一致性,那么这个初始图应该是一个“差异图”,它显示了y轴上的测试减去比较结果与x轴上的比较结果之间的差异,如附图所示。这些差异应该分散在零差异线周围,一半在上面,一半在下面。任何大的差异都会突出,并引起人们对那些需要通过重复测量来确认结果的标本的注意。

寻找任何不属于其他数据点的一般模式的离群点。例如,在图中有一个可疑点。还需要注意的是,浓度低时,这些点往往分散在线以上,浓度高时分散在线以下,这表明可能存在一些恒定和/或成比例的系统误差。


对于不期望显示一对一一致的方法,例如具有不同反应条件的酶分析,该图应该是一个“比较图”,在y轴上显示测试结果,在x轴上显示比较结果,如图2所示。随着点的累积,应该绘制一条最佳拟合的视觉线,以显示方法之间的一般关系,并帮助识别差异结果。同样,对数据进行初始图形检查的目的是识别差异结果,以便在标本新鲜和仍然可用时重新分析标本。

然而,这种类型的图表通常有利于显示数据的分析范围,响应在该范围内的线性关系,以及由直线的角度及其与y轴的截距所显示的方法之间的一般关系。

计算适当的统计数据

虽然差异图和比较图提供了测试方法和比较方法之间分析误差的直观印象,但这些误差的数值估计可以从统计计算中获得。记住方法验证的内在的、隐藏的、更深的、秘密的含义是错误分析。您需要知道存在哪些类型的错误以及它们可能有多大。统计计算将为您的视觉印象误差提供更准确的数字。

鉴于比较方法实验的目的是评估不准确性,所计算的统计量应提供有关医学重要决策浓度的系统误差的信息。此外,了解该误差的恒定或比例性质将是有用的(审查)QC -实验计划对于常数和比例误差的定义)。后一种信息有助于确定系统误差的原因或来源,并评估改进方法性能的可能性。

对于覆盖广泛分析范围的比较结果,例如,葡萄糖或胆固醇,线性回归统计是优选的。这些统计数据允许对多个医疗决策集中的系统误差进行估计,以判断方法的可接受性,并提供有关系统误差的比例或恒定性质的信息,以评估可能的误差来源。统计程序通常提供线性回归或最小二乘分析,计算最佳拟合线的斜率(b)和y截距(a)以及该线周围点的标准差(s)y / x).给定医疗决策浓度下的系统误差(SE)c),然后通过计算相应的Y值(Yc),然后取Yc和Xc,详情如下:

Yc= A + bXc
Se = yc- Xc

例如,某胆固醇比较研究的回归线为Y = 2.0 + 1.03,即Y截距为2.0 mg/dL,斜率为1.03,则临界决策水平为200时对应的Y值为208 (Y = 2.0 + 1.03*200),即在临界决策水平为200 mg/dL时存在8 mg/dL(208 - 200)的系统误差。

计算相关系数r也很常见,它主要用于评估数据范围是否足够宽,以提供对斜率和截距的良好估计,而不是判断方法的可接受性[3]。当r为0.99或更大时,简单的线性回归计算应提供可靠的斜率和截距估计。如果r小于0.99,则最好收集额外的数据来扩大集中范围,或者考虑使用t检验计算来估计数据均值处的系统误差,或者使用更复杂的回归计算来适用于更窄的数据范围[4]。

对于覆盖较窄分析范围的比较结果,如钠或钙等,通常最好计算结果之间的平均差值,即两种方法的平均值之差,也通常称为“偏差”。这种计算偏差通常可以从提供“配对t检验”计算的统计程序中获得。计算还包括一个“差异的标准偏差”,它描述了方法差异之间的分布,以及一个“t值”(t),它可以用来解释数据是否足以得出方法之间确实存在偏差或差异的结论

例如,如果采用测试方法对钠进行40次分析的平均值为141.0 mmol/L,而采用比较方法对同一样品进行分析的平均值为138.5,则平均系统误差或偏差为2.5 mmol/L(141.0 - 138.5)。这种偏差的代数符号对于显示哪个方法更高或更低很有用,但对于判断方法的可接受性来说,重要的是差异的绝对值。

可接受性能标准

可接受性的判断取决于在不影响或限制单个检测结果的使用和解释的情况下允许的分析误差的大小[5]。由于任何单独的测试结果也会受到随机误差的影响,因此总体或总误差(TE)由系统误差(SE)加上随机误差(RE)组成,这使得情况变得复杂。这个“总误差”可以计算如下:

TEcalc= se + re
TEcalc=偏见+ 3年代

其中smeas是对复制实验的方法标准差的估计,而biasmeas是t检验计算的平均差异或平均值之间的差异或Yc- xc在Yc= a + bXc来自回归统计。当计算出总误差(TE)时,方法性能是可以接受的calc)小于允许总误差(TE)一个).记住CLIA能力测试标准可接受的性能以允许总误差的形式出现,为设定分析质量要求提供了一个良好的起点。

类似的可接受性判断可以使用图形方法决策图[6]。这个图表可以让你画出偏见y轴和s轴在x轴上,然后通过该“操作点”相对于图表上绘制的不同总误差标准的线的位置来判断可接受性。

建议最少学习次数

选择40例患者标本,以覆盖该方法的全部工作范围。采用试验对比法,每天2小时内分析8个标本。立即在差异图上绘制结果并检查差异;重新分析任何产生差异结果的标本,以消除异常值并识别潜在的干扰。如果没有观察到不同的结果,继续实验5天。如果在前5天观察到差异,继续再进行5天。准备所有数据的比较图,以评估范围,异常值和线性。计算相关系数,如果r大于等于0.99,则计算简单线性回归统计量并估计医疗决策浓度下的系统误差。如果r<0.99,则从t检验统计量中估计偏倚。利用医疗决策图将系统误差和随机误差的估计结合起来,对方法观察到的总误差进行判断。

引用:

  1. NCCLS EP9-A:使用患者样本的方法比较和偏倚估计。国家临床实验室标准委员会,韦恩,宾夕法尼亚州,1995年。
  2. Hyltoft Petersen P, Stockl D, Blaaberg O, Pedersen B, Birkemose E, Thienpont L, Flensted Lassen J, Kjeldsen J.利用差异图对野外法与参考法分析数据的图解解释。中华临床医学杂志1997;43(3):2039-2046。
  3. Westgard JO, Hunt先生。方法比较研究中常用统计检验的使用和解释。临床化学1973;19:49-57。
  4. 王晓明,王晓明,王晓明,等。方法比较研究中最小二乘回归系数的不正确。中华医学杂志1979;25:432-438。
  5. 魏嘉德,王志强,王志强,等。方法开发和评价中精密度和准确度的判断标准。中华临床医学杂志1974;20:825-833。
  6. Westgard乔。一种用于判断方法性能的方法评价决策图(MEDx图)。临床检验科学1995;8:277-283。
Joomla SEF url由Artio提供