医疗保健实验室的工具、技术和培训

客人的文章

《临床实验室测量不确定度指南》

Graham White博士提供了测量不确定度(MU)的解释,它在临床实验室中的作用,以及它比使用总误差的优势。

临床实验室测量不确定度(MU)搭便车指南

2012年4月

格雷厄姆白
SA病理学,弗林德斯医疗中心,贝德福德公园,阿德莱德,SA 5042澳大利亚
此电子邮件地址被保护免受垃圾邮件机器人。您需要启用JavaScript才能查看它。

在James Westgard最近发表的关于CLSI MU指南的文章之后,我感谢您邀请我进一步讨论测量不确定度。搭便车的人喜欢让事情变得简单,有一张容易理解的地图,以最小的不适到达目的地。这篇文章的目的是用最少的术语和统计数据,向常规的实验室人员简要地展示MU是合乎逻辑的,易于理解的,有用的,适合在临床实验室实施的[1、2]。

哪些类型的实验室测量应该使用MU?

所有用数字(如4.6、1 × 10)表示幅度的测量9)和参考(如mmol/L,量纲一),如测定血浆钙浓度、白细胞计数、CAG核苷酸重复数。

为什么MU在常规临床实验室中很重要?

临床医生将大多数测量结果与参考值和同一患者以前的结果进行比较。因此,结果应该是可靠和准确的,但在实践中,它们受到误差的影响。在验证常规测量程序的性能特征时,通常进行可重复性实验,即在尽可能保持恒定的条件下对同一样品进行重复测量。如果测量系统足够灵敏,通常会得到一系列不同的结果。哪个是样本的真实结果?我们显然不能说,但很明显,结果必然包含一些误差,而且对于不同的结果,误差的大小是不一样的。因此,真正的价值是什么是不确定的。如果在重复条件下反复测量患者样本,结果的离散性也会得到类似的结果。

一份患者报告显示,相隔一周采集的两份样本的血清大黄结果分别为3.1 mmol/L和3.3 mmol/L;上参考值:3.0 mmol/L。临床医生问实验室:第一个结果肯定高,第二个结果真的比第一个结果高吗?如果没有与每个结果相关的测量不确定度的定量知识,实验室无法回答。

总误差(Total Error, TE)方法有帮助吗?

TE方法将系统误差(Bias)和随机误差(Imprecision)识别为总测量误差的两个组成部分。偏倚是参考值对结果的可预测偏移,通常估计为参考值与通过常规测量程序重复测量参考值时获得的平均结果之间的差。所选择的参考值可以是经过认证的参考材料,EQA中的同行组平均值等。因此,偏置有一个值,可以用来消除或最小化偏移,例如,通过重新校准或通过使用校正因子调整原始结果。

由于机电性能的波动、试剂和校准器批次的变化、不同的操作人员、日常仪器维护等因素,化验产生的每个测量结果的不精度程度是不可预测的。通常通过在不同的分析运行中测量QC材料,在足够的时间内,包括尽可能多的上述测量条件的常规变化,来估计不精度。同一批QC在一段时间内获得的结果的分散被认为近似于高斯(正态)分布,因此分散的大小可以统计量化为平均值的标准差(SD)。实验室做出这样的假设,这并不总是正确的,即患者样品在测量系统中的行为与QC样品一样,因此,如果患者样品被重复测量,即具有相似的不精确性,则结果的离散性预计是相似的。

总误差概念将测量系统的总误差描述为:TE = Bias + 1.65 SD,其中1.65 SD表示在不精确高斯曲线的一侧获得的结果的~ 95%分散度。

总误差概念(TE)的局限性

总误差方法在应用于单个结果时存在几个问题:

1.偏置值不能确切地知道。例如,分配给认证标准物质的分析物值是不精确的,以x±y单位的形式表示。此外,常规化验法从重复测量中获得的参考物质的平均值不可避免地具有不精确性,因此使用常规程序的平均值也采用x±y单位的形式。由于用于计算偏置的两个值都具有不确定性,因此偏置值不能准确已知。同样,随机误差也只是随机误差而已,因此不能对单个测量结果精确地知道它。因此,不能确切地知道测量结果的总误差。即使使用最先进的参考测量程序,这也是不可避免的,这就是为什么分配给认证参考物质的分析物值以x±y单位的形式表示。

2.总误差计算为Bias值+ 1.65 SD。如果测量过程中的偏差值是已知的,为什么总误差方法将其包括在总误差的计算中,而不是通过重新校准或对原始结果应用校正因子来消除或最小化它?如果偏差值无法获得,则偏差是未知的,无法解决。

3.TE计算将偏置值添加到概率分布(1.65 SD)中,以计算测量系统误差的上可能值。这就像加了一个苹果和一个梨。正如我们从QC结果中所知道的,同一材料的单个结果包含不同的误差大小,这就是为什么我们看到结果的分散。这就是为什么TE方法不能应用于个体结果,因为它不允许任何个体患者结果的不精度可能不同于1.65 SD的可能性。

总而言之,虽然测量误差不能精确地知道,但总误差概念具有理论价值,并且在实践中,在需要为测量结果设定可接受的总误差上限的情况下是有用的,例如血浆胆固醇测量,运动中的药物。当考虑单个结果的不确定性时,该方法不适用。

什么是测量不确定度(MU)?

与TE相反,MU不关心估计测量误差。常规实验室通常只测量一次患者样本,而不是多次,因此MU方法侧重于识别如果样品被重复测量而不是一次测量可能获得的分析物结果的离散性。为了做到这一点,MU方法使用来自给定测量系统的关于重复测量的可用数据来定义一个值的区间,在这个区间内,被测量分析物的真实值被认为是存在的,具有规定的置信度。例如,如果血浆葡萄糖浓度结果为4.5 mmol/L,则适当的MU信息的可用性可能使实验室有95%的置信度认为样品中葡萄糖浓度的真实值在4.4-4.6 mmol/L范围内。

总之,MU不估计误差,但提供了一个定量的估计,被测量的分析物的真实值被实验室认为是在一个确定的置信水平。因此,测量不确定度这个术语往往会给人一种错误的印象,因为它实际上是实验室对结果质量的信心或信念水平的定量指示。因此,MU是测量结果可靠性的重要参数。MU的基本参数为1sd。注:MU是测量结果的属性,而不是产生测量结果的测量过程。

MU包括什么?

患者测量结果变异性的许多潜在来源传统上分为测量前(如人体内生物变异、压力、药物、样品运输等)测量和测量后(如结果四舍五入)。对于许多分析来说,测量前的可变性的幅度超过了与测量过程相关的可变性。然而,MU只关注测量过程本身的不确定性,例如,初级管取样或样品制备到结果输出。对于特定的分析物或临床目的,如果可以用SD表示,分析前不确定度可以与MU结合使用。

MU如何处理偏见?

偏倚是相对于适当参考的可预测的偏移值,例如,经认证的二级或常规参考物质的指定值,或EQA或实验室循环赛中同行组或所有平均目标值,如果寻求改进的测定间比对。无论采用何种方法来确定常规测量程序的偏差值,MU方法都假设已知偏差已被消除或最小化,例如通过重新校准。如上所述,不可能确切地知道偏置值,因此不可能完全消除偏置。MU方法认识到用于偏差校正的值具有相关的不确定度,即参考值本身的不确定度(如果可用)和由测量程序产生的参考值的重复测量获得的平均值的标准误差的组合。因此,偏置值的不确定性表示为SD。如果偏见无法估计,那么它的大小是未知的,也无法解决。

总之,如果偏差是已知的并且被认为是显著的,那么它应该在测量系统中被消除或最小化。至于偏见是否被认为是显著的,可能是统计上确定的,或者是一个专业判断。0.1 mmol/L的血浆钙测量偏差显然是显著的,而0.001 mmol/L的偏差则不太可能被认为如此。如果已经估计了偏差值,则必须考虑用于偏差校正的值的不确定性,以便将其包含在给定测量程序产生的结果的总体MU计算中。

MU是如何估算的?

由于MU方法要求消除或最小化已知偏差,或者忽略未知偏差,因此我们剩下:

  • 测量系统不精确
  • 如果偏差被消除或最小化,使用偏差值的不精确性。

对于大多数测量系统,中间可重复性不精确的程度相对于偏置校正的程度要大,因此对于大多数测量程序,MU只是使用QC评估的中间可重复性,通常表示为1 SD或CV %。

测量程序通常是自动化的“黑匣子”系统,不允许单独研究组件(例如采样/试剂探针,水浴,分光光度计等)以确定其不确定度。幸运的是,我们对单个可变性源对测量结果的综合影响感兴趣,这在QC样品获得的结果的分散中得到了充分的反映。由于患者的结果是相互比较的,并且随着时间的推移与参考值进行比较,因此用于MU计算的QC数据应在足够的时间内获得,以捕获由于测量系统中常规发生的变化而引起的可变性,例如试剂和校验器批次的变化,不同的操作人员,日常维护等,即中间可重复性。大多数测量程序都足够稳健,不精密度通常在试剂批次之间变化不大,因此不精密度可以通过组合它们的SDs来计算(参见下文如何组合SDs)。对于不经常执行的测量程序,获得足够的数据(>100个结果)需要更长的时间,在这种情况下,临时计算是合适的,但在任何情况下,包括新程序,至少需要30个QC结果,才能合理地假设数据点的近似高斯分布。此后,随着QC结果的累积,应该定期重新计算不精度,直到SD稳定在与报告结果相同的小数位数上。

最简单的是,在足够的时间内计算用于给定测量程序的每个QC级别的平均值和SD,以包含尽可能多的常规程序更改;至少30个值对于初始MU估计是足够的。MU的参数为1 SD (标准测量不确定度,符号μ)。由于质量控制的标准差反映了测量系统内产生的所有单个不确定度的综合效应,因此标准差可视为组合标准不确定度(μc),在特定QC的平均值附近为患者结果。

由于±1 SD仅覆盖了获得的QC值分散度的~ 68%,因此通过应用覆盖因子(k)来提供an,可以扩大不确定性扩展测量不确定度(象征U)。通常选择k = 2,以提供更有用的95.5%的结果离散度覆盖率。假设这种分散也适用于患者的结果,那么结果可以是x±y(95%置信度)的形式,其中y = 2 SD(即2 x μ)c=U)。如果使用了几个级别的质量控制,则应计算每个级别的MU,并判断它们是否有足够的差异,以保证在每个质量控制级别所涵盖的范围内使用它们的患者结果。

考虑以下血清大黄测量程序的QC数据。校准值由检测制造商内部指定,并且si可追溯或常规参考物质无法进行偏差评估。在外部质量评估程序中,相对于同行组的表现显示,与组平均值的偏差总是<0.1 mmol/L。考虑到结果的临床应用,偏倚被认为不显著,因此在MU计算中被忽略。

质量控制 07/27/11 - 09/14/11 意思是(更易/ L) SD(μc 2sd (U) (U= 2 x μc
1级 n = 86 4.9 0.12 0.24 = 0.2
2级 n = 86 28.7 0.73 1.46 = 1.5

采用中间重现性条件下的不精密度计算MU。由于患者结果报告到小数点后一位,因此扩展后的MU (U)的处理方法类似,即患者结果在以下监测范围内:

QC一级:x1±0.2 mmol/L(95.5%置信度);QC等级2:x2±1.5 mmol/L(95.5%置信度)。

例:患者1结果:6.3±0.2 mmol/L(~ 95%置信度)。这意味着实验室有~ 95%的置信度,真实值在6.1-6.5 mmol/L的范围内。

患者2结果:34.6±1.5 mmol/L(~ 95%置信度)。这意味着实验室有~ 95%的置信度,真实值在33.1-36.1 mmol/L范围内。

真实值的最佳估计总是报告的结果,但这种表示MU的方式表明可以获得其他结果。注:未提及误差。MU与真值所在位置的概率有关。注:术语“真值”与用于校准的参考值有关,可能是任意设定的值,例如世卫组织国际单位。

如果偏见被认为是显著的呢?

假设大黄测定结果相对于国际专家机构定义的决策值进行临床解释,不正确的解释可能具有有害的医学含义。因此,测量偏差很重要。幸运的是,检测制造商使用经过认证的二级(矩阵匹配)参考物质(CRM)分配校准器值,该标准物质在计量上可追溯到SI单位(摩尔),并声称校准器可与CRM交换。实验室购买一瓶CRM,在可重复性条件下测量10次。

认证的价值 1 sd (μ)c 实验室重复性研究(n=10) 1 sd (μ)c 偏见
CRM 3.87±0.028 mmol/L
(95.5% ci)
0.014 L更易 平均值= 3.97±0.12 mmol/L
(95.5% ci)
0.06 L更易 0.10 L更易

0.1 mmol/L的正偏差被认为是显著的,适用于整个测量范围,因此该分析被重新校准到该值。我们需要计算0.1 mmol/L值的不确定度。这种计算使用1 SD (μc),而非2sd (U),因此该方法的标准不确定度为0.014 mmol/L。实验室得到的平均值的不确定度为十次测量的平均值的标准误差,即0.06/√10 = 0.019 mmol/L。我们现在将CRM的不确定度和实验室平均值结合起来,给出0.1 mmol/L偏置值的联合标准不确定度。因为SDs不能相加,所以需要将它们转换为方差(SD)2),可以添加。然后,通过取平方根将组合方差转换回组合标准差,例如,偏差值ubias的组合标准不确定度=√(0.0142 + 0.0192)= 0.0236 mmol/L。

然后将偏差值的不确定度与长期QC不精确度进行比较,例如0.0236是0.22 mmol/L的~ 11%,并且被认为是足够大的边界,可以包含在大黄程序产生的结果的总MU的计算中。偏差不确定性和质量控制不精确以同样的方式结合在一起。

对于QC级别1附近的值:μc=√(0.02362 + 0.122)= 0.1223 mmol/L

2级:μc=√(0.02362 + 0.732)= 0.730 mmol/L

扩展的标准不确定度(U)为0.122 x 2 = 0.244 mmol/L(四舍五入至0.2 mmol/L);QC 2: 0.73 x 2 = 1.46 mmol/L(四舍五入到1.5 mmol/L)。

在QC 1级监测范围内的患者结果:x±0.2 mmol/L(95.5%置信度);QC等级2:x±1.5 mmol/L(95.5%置信度)。注意:MU值四舍五入到与报告结果相同的小数位数。

在这个例子中,包含偏差不确定性对仅使用长期QC不精确数据确定的扩展不确定性没有任何有意义的改变。由于这个原因,如果偏置值小于中间不精度的20- 30%的任意截止值,实验室通常会忽略偏置值的不确定性。

如何计算由几个其他结果计算的测量的MU ?

例如阴离子间隙= (Na+ + K+) - (Cl- + HCO3-)

同上。假设Na+ = 1.1 mmol/L, K+ = 0.1 mmol/L, Cl- = 1.2 mmol/L, HCO3- = 0.8 mmol/L时的uc (1 SD)

μAG =√(1.12 + 0.12 + 1.22 + 0.82)= 1.82 mmol/L;U= 3.64 mmol/L。适当的舍入使不确定度扩大到±4 mmol/L。

请注意,虽然AG计算包括加法和减法,但标准不确定度以相同的方式组合。如果计算参数包括除法和/或乘法(例如肌酐清除率),则在计算前必须首先将SDs转换为CV,即√CV12 + CV22 + CV32 +…等)。

应该如何评估综合成本评估?

在开始计算MU之前,实验室必须为每种分析物设定临床可接受的MU目标,例如血清钠、尿钠等。如果没有指标说明临床可接受的表现需要什么,那么估计MU就没有什么意义。这里不讨论这一重要方面,因为设定目标的方法在其他地方有很好的描述。例如,使用生物变异数据、国际专家组建议、专业意见。

总结

上面描述的方法称为“自顶向下”。已知的显著偏差应消除或最小化,并根据偏差值的不确定度评估残余偏差,用于重新校准或结果校正。相对于不精确,偏置不确定度通常是微不足道的,并且被忽略,因此中间QC不精确数据捕获了测量结果的总体不确定度。MU数据应定期更新。

“自下而上”的方法估计与测量系统的各个组成部分相关的不确定性,并将它们组合在一个模型中,以反映它们在整个测量系统中的影响。这种方法最适合IVD医疗设备制造商验证新的测量程序或寻求可以减少MU的技术步骤的需求,也适合开发内部测量程序的实验室。有关自底向上的方法,读者可参阅最新的CLSI C-51指引[3.]。

MU应该常规报告给临床医生吗?

没有,但应在需要时提供,例如临床试验、临床研究。

MU对实验室有用,因为它:

  • 提供定量证据,证明测量结果符合临床对可靠性的要求
  • 是否对使用相同测量程序的结果与参考值进行有意义的比较至关重要
  • 可以提供哪些技术步骤可以改进的见解,从而减少整体MU
  • 是通过计量溯源实现标准化和协调测量结果的重要组成部分。

*MU可用于评估患者的结果是否与参考值或先前结果有95%的可测量性差异,或与个体内生物学变异相结合,与Fraser(4)描述的方式完全相同。

MU和TE的总结

  • TE为测量系统的误差提供了一个近似的最坏情况值。
  • TE没有认识到每个患者的结果可能有其他可能的结果,误差小于Bias + 1.65 SD。
  • TE用于设置允许误差的上限。
  • MU与估计测量系统的总误差无关
  • MU关注的是估计一个值的区间,在这个区间内,被测分析物的“真实”值被认为是存在的,具有规定的置信度。
  • 已知的偏差被消除或最小化
  • MU认为单个测量结果是对真实值的最佳估计,并以它为中心,如果重复测量(通常具有~ 95%的置信度),则可以获得其他值的离散度。
  • MU是将测量结果与参考值和以前同类结果进行有意义的比较的适当方法。

参考文献

  1. 白色的GH。测量不确定度估计的基本知识。中华生物医学工程杂志,2008;29:553 - 560。
  2. 测量不确定度的估计要求。国家病理学鉴定咨询委员会,澳大利亚政府卫生和老龄部,2007年。www.health.gov.au搜索NPAAC出版物(访问2/04/2012)。
  3. C51-A。检验医学测量不确定度的表达。CLSI,韦恩,宾夕法尼亚州。
  4. 弗雷泽CG。生物变异:从原理到实践。2001;AACC出版社,华盛顿。
Joomla SEF url由Artio提供