医疗保健实验室的工具、技术和培训

客人的文章

口香糖有害吗?-或者只是多余的?

什么是GUM?好吧,这不是你咀嚼的东西。它是ISO测量不确定度指南。随着ISO标准在世界范围内越来越广泛地用于实验室认证,GUM将被实验室和制造商更广泛地使用。但是GUM有用吗?多余的?有害吗?最近,一个由七名斯堪的纳维亚科学家组成的小组检查了GUM并评估了它的实用性。我们很高兴分享他们的发现。

1丹麦欧登塞大学医院临床生物化学系
2NOKLUS,挪威卑尔根大学全科医学司初级保健实验室外部质量保证中心。
3.丹麦韦勒县医院临床生物化学科
4丹麦罗斯基勒医院临床生物化学科。

对应到
Per Hyltoft Petersen,
临床生物化学系,
欧登塞大学医院
DK-5000欧登塞C。
电话:+45 6541 2836
传真:+45 6541 1911

请注意:这是翻译和改编自“Klinisk Biokemi i Norden”中的一篇丹麦论文:“Er GUM skadelig ?”- eller blot overflo ødig“Klinisk Biokemi i Norden 2003;第27 - 31 15(2):。经特别许可在此发布。

编者按

本文通过《测量不确定度指南》(GUM)讨论了“不确定度”的概念及其实现。

美国读者可能会对这个话题的相关性感到疑惑,因为GUM在北美并没有被广泛了解和应用,然而,欧洲的临床化学家几年来一直在关注它的实施。随着ISO标准在世界范围内越来越广泛地用于实验室认证,GUM将被实验室和制造商更广泛地使用。ISO强调使用“真实度”和“不确定度”来描述测量过程的质量,而不是我们更传统的总误差、准确度和精密度的概念。

  • 真实ISO用它来描述“从大量测量结果中得到的平均值与真实值之间的一致程度”。强调“从大量测量结果中获得的平均值”将这一概念限制在方法的系统误差或不准确(偏差)。
  • 不确定性ISO用它来描述“与测量结果相关联的参数,该测量结果表征了可合理归因于测量值的离散度。”这个术语可以通过计算标准偏差或某些倍数(置信区间)来定量描述。

简而言之,新的ISO术语建议正确而不是准确、不准确或系统误差和不确定性而不是随机误差、不精确或精确。完全错误将不存在!此外,不确定性的估计将通过误差计算的传播结合不同的来源和随机误差和系统误差的估计。这些计算需要一个有能力的统计学家,一个有一些数学或统计能力的临床化学家,或者一个可供实验室分析人员使用的特殊计算机程序。最后,正如我们之前在本网站上讨论过的那样,人们担心这些新数字是否有任何实际用途(参见不确定还是错误?这就是问题所在).这就是为什么我们邀请了一群杰出的斯堪的纳维亚临床化学家发表评论。


摘要

GUM(测量不确定度指南)于1993年引入,现在经常要求欧洲实验室认可。讨论中有以下问题值得关注:
  1. 我们能从GUM得到什么新信息?
  2. 我们在GUM上失去了什么?
  3. 介绍了哪些误解和问题?
  4. 引入了哪些错误?

我们的立场是,不确定性的GUM定义,包括对偏差和精度的估计,并不是对方法性能的有用描述。例如,在不同批次的试剂或不同试剂盒的情况下,偏差通常是未知的(这与不确定不同),未知偏差应该通过使用具有参考方法值的矩阵校正对照或使用参考方法和现场方法测量的患者样本来估计。这些类型的偏差不应该用更广泛的扩展不确定性来描述,而应该估计并与可接受偏差的分析质量规范进行比较。

结果还表明,相同的不确定度值可以涵盖不精确或未知偏差。对于空腹血糖,60岁以上且BMI>27的“低风险”男性(测量值高于7.0 mmol/l)的百分比从无误差情况下的0.8%增加到纯不精确情况下的2.3%或纯偏差情况下的10.7%或14.3%(取决于计算方法),两者都被描述为10%的扩大不确定性。因此,相同的不确定性值可能导致相当不同的临床结果,无论不确定性是否包括不精确或(未知的)偏倚。

我们的结论是:

  • 我们没有从GUM那里得到任何有用的新信息
  • 我们失去了一个区分不精确和偏见的重要而有用的工具。
  • GUM在误差概念中引入了许多不确定因素,并引入了一些未解决的问题。
  • GUM对实验室数据的临床解释提供了错误的信息。

因此:口香糖不仅是多余的,而且是有害的。

介绍

GUM (Guide to Uncertainty in Measurement,测量不确定度指南)[1]是一个新概念,自1993年提出以来,在临床生物化学领域的影响越来越大。在一些国家,尽管ISO 15189和ISO 17025标准中没有直接要求,但在处理认可的数量时,建议根据既定预算根据GUM表示测量不确定度。计算要求很高,即使临床化学家如Jesper Christensen已经试图减轻工作量[2],但这仍然是一项复杂的任务。

GUM的思想是建立一种描述质量的通用方法。该方法是将所有差异转换为方差/标准差/变异系数,这些差异被总结为一个“普遍不确定性”。这还包括归因于修正偏差、转换未知偏差和所有其他非量化贡献的变化。所有这些组成部分——连同假定的不确定性——组合成一个不精确估计,现在称为不确定性和扩展不确定性。

我们能从GUM得到什么新信息?

该系统是复杂的,因为它是基于许多理论贡献的不确定性的最终估计。在这方面,GUM是静态的,没有当前的兴趣,并且在最好的情况下,在较早的时间显示人工条件下的情况。

GUM是作为一种工具引入的,通过方差调查来调查不确定性链中的最薄弱点,但是对于该应用程序来说,它是不必要的,因为我们已经为同样的目的进行了30年的方差分析。此外,“因果图”也被称为“鱼骨图”的应用声称是新的,但它自1990年以来一直在临床化学中使用。

GUM在描述参考方法的不确定度方面可能更优,但在常规临床生化实验室中影响不大。

我们在GUM上失去了什么?

随着GUM的引入,我们失去了区分不同类型的分析错误的能力,这些分析错误对分析的实际质量有不同的影响。我们已经失去了关于偏差、不精确、干扰、特异性等各个组成部分的信息。GUM要求将所有这些错误收集到一个未指定的变量中,即根据GUM的不确定性。因此,GUM隐藏了有关单个错误组件的信息。

我们当然有兴趣避免一定规模的分析偏差,而不是将其包括在不确定性的估计中。我们知道我们的分析方法会受到系统变化的影响,我们可以通过内部质量控制(IQC)来监控这些变化,以便发现系统错误并通过纠正措施消除它们。

如果我们遵循GUM,只是描述这些条件,并因此接受不确定性的增长,那么结果是不可预测的,结果质量也不令人满意。

GUM带来了哪些误解和问题?

根据GUM,所有的错误都是不确定性的一部分,尽管这不是一个正确的术语。举个例子:如果你把一个骰子放在一个盒子里并摇晃它,有六种可能的结果。当掷出骰子,但结果被盒子藏起来时,结果不是不确定的,而是未知的。未知的结果可以通过移除盒子来揭示。这与不确定性不同。然后,步骤是不确定的,未知的,已知的。

从参考方法到实验室分析的可追溯链可以看作是一个类似的过程。对于每一步,参考方法后,可能会估计偏差。它是未知的,但可以通过时间和金钱的投入来衡量。重复次数越多,置信区间越窄,成本越高。

Thienpont等人[3]研究了GUM在理论上可以描述哪些量。这是通过区分所谓的SI分析物(理论上可追溯到定义良好的成分和参考方法)和所有其他成分(未定义良好或由参考方法决定)来完成的。SI分析物,原则上可以用GUM来描述。电解质和简单代谢物有30到40种。其余的是自由分析物,例如,离子化钙,具有较小或较大偏差的分子“家族”,例如,蛋白质(IgG由超过10x106种不同的分子形式组成)和激素(通常基于以国际单位(IU,如hCG)给出的参考制剂进行定量的成分)。因此,GUM可能只对少数数量有用。

即使对于SI分析物,可追溯性链通常涉及其矩阵以不同方式操作的材料,以及依赖于矩阵的分析方法,从而在可追溯性链中引入偏差。为了纠正这一点,应该在大量患者样本中使用拆分样本测量,然而,这将违反可追溯链的思想。

在外部质量控制或同行评估(即使是SI分析物)中发现了进一步的困难,其中使用了矩阵正确的材料和参考方法值。这就引入了对照材料结果的解释之间的差异,对照材料的解释来自具有参考方法浓度的基质正确材料,而我们的试剂盒具有未知偏差,来自相当长的可追溯链,具有操纵和不可交换的基质。直到外部控制显示出偏差,才会发现偏差。

当高质量的外部控制发现有偏见时,应该怎么做?

  1. 用校准器重新校准?然而,这将没有帮助,如果问题是操纵材料校准。
  2. 在对照调查结果的指导下重新校准?可以尝试这样做,但不允许这样做,尽管控件的层次结构更高。
  3. 使用与对照品质量相同的国家或地区标准制剂进行校准?实际上,这是在Nordic Reference interval-project[4]中完成的。
  4. 延长置信区间?根据GUM,这将是合法的,尽管这是否提供任何实用价值是一个问题。

GUM引入了哪些错误?

尽管有几种方法是众所周知的,但GUM已被宣布为结合偏差和不精确的唯一模型。包括GUM在内的所有这些方法都有缺点和优点,这些都是GUM无法解决的[5]。描述质量最安全的方法是在概念上和实验上分别识别偏差和不精确。这与他们对临床结果的个体影响有关。这仍然是正确的,正如Box和Luceño[6]所说的“所有模型都是错误的,但有些模型是有用的”。在这方面,GUM不如我们的传统模型有用。

以下是来自临床生物化学的一些例子,说明GUM如何通过将偏见解释为不确定性而引入错误的估计。

1 .在丹麦,允许全科医生在执业过程中测量INR。如果每个全科医生都有有效的控制服务,这将是一场经济灾难和巨大的工作量。因此,根据分析质量规范,对inr试剂盒的每个新批号进行偏差和不精确测试。这是通过根据定义的丹麦参考方法分析40例患者样本作为分裂样本来完成的。在与试剂盒分销商的协议中,只有满足偏差和不精确目标的试剂盒才能出售。每个批号都有一个明确定义的偏差,这是可以注意到的,但只有当它是已知的。由于样本数量多,置信区间小,因此可以对批次进行验证,而根据GUM产生的偏差可以通过创建更大的不确定性来隐藏。

2Thienpont等人观察到捷克共和国血清中胆固醇的平均偏倚为+ 5.1%[7]。在这种偏倚的情况下,高胆固醇血症的确诊病例比没有偏倚时多10%。将这种偏差集中到对不确定性的估计中不会改善临床实践,但消除这种偏差会改善临床实践。这就是为什么保持对提高质量有用的传统模型和工具是很重要的。

3Kallner计算了血糖测量的不确定度[8],并确定了总相对不确定度为14%。用2的倍数来描述95%的不确定度,即结果的不确定度为28%,则5.5 mmol/l的真值指的是介于4.0和7.0之间的真值。很有趣,但在临床上没有用!

IV. Linko等人(9)已经证明,对于葡萄糖,包括受试者内的生物变异将使不确定性扩大到14%。这是kallner值的一半。更有趣的是对另外两种葡萄糖的估计(不包括生物变异),结果的不确定度分别为2.4%和2.6%。这也很有趣,虽然不现实。因此,即使这些估计是用适当的方法和最好的意图作出的,也可能得到过大或过小的不确定性。

不确定性的不确定值的论证

让我们考虑在使用实验室检测进行监测和诊断的情况下,这些不确定性估计的有用性。

在监测中,两次连续测量之间的差异通常是非常有价值的。测量到的差异通常与参考变化值(RCV)进行比较,RCV可以从1.96*2计算出来½*CV,其中1.96*CV与扩展不确定度匹配,CV是受试者内的生物变异(这里葡萄糖约为5%)½解释了这两次测量。因此,RCV为14%,但根据Kallner和Linko的说法,它将达到2%½*40%和2½分别* 20%。此外,如果在同一仪器上分析,方法偏差将对两个结果产生同等影响。因此,RCV变成了一个不切实际的大值,对于理解患者检测值的变化在临床上是否重要毫无用处。

在诊断方面,Jørgensen等人发现健康女性的血浆葡萄糖浓度低于健康男性,且浓度随年龄和BMI增加而增加(10)。如果考虑年龄在60岁以上且BMI大于27 kg/m2的低风险男性,则在无误差情况下,测得血糖高于7.0 mmol/L的风险为0.8%。

让我们考虑根据GUM将不确定性扩大5%或10%对两种不同不确定性来源的影响:

  • 不确定性完全是由随机误差(不精确)造成的;
  • 不确定性完全是由正偏差引起的——根据GUM和总量计算。

对血糖值高于7.0 mmol/L患者比例的影响见表1和图1:

表1

年龄在60岁以上、BMI在27 kg/m2以上的“低风险”人群中,血浆葡萄糖高于7.0 mmol/l的百分比。不确定度的百分比以5%和10%的扩展不确定度给出,仅以不精确度和偏差计算。对于不精度计算E = 2*CV(分别对应CV = 2.5%和5%),对于未知偏差计算根据GUM: E = 2* (a/3)½).结果是a = E*3½/2,即4.3%和8.7%,而“已知”偏差为5%或10%

不确定性扩展 专门不精确 偏见口香糖 偏见只
没有错误 0.8% 0.8% 0.8%
5% 1.2% 3.5% 4.2%
10% 2.3% 10.7% 14.3%

扩展不确定度为5%的结果如图1所示

Rankit图中,年龄在60岁以上且BMI大于27 kg/m2的男性的血糖分布以直线表示。横坐标单位为mmol/L,纵线表示血糖7.0 mmol/L。无误差(黑线,无偏差,无不精确)和两种扩展不确定性= 5%的情况下的分布:扩展不确定性在这里专门指随机误差(紫色线),与无误差情况几乎无法区分,也适用于扩展不确定性可以专门指系统误差的情况(右边的蓝线)=健康低风险病例数量较多且血浆葡萄糖> 7.0 mmol/l的线。


这个例子表明,如果结果完全基于随机和系统误差,在相同的扩展不确定性下,临床结果可能会非常不同。这是在未知错误的情况下。在购买套件或校准器时,不确定度应包含在信息中。然而,对于用户来说,这是一个偏差,可以通过分裂样品原理或矩阵正确控制材料来知道-但在调查之前是未知的。

不确定性测量不具有信息性,因为偏差也作为不确定性给出,基于偏差(未估计)的临床结果将与基于具有相同不确定性值的随机变化的结果不同。

Thienpont等人发现捷克共和国的血糖平均偏差为+3.7%[7]。这相当于60岁以上且BMI高于27 kg/m2的低风险男性增加3%。这听起来很小,尽管它将在整个国家或欧盟成为相当多的病例。

偏见和不精确对生物学和临床情况的影响之间的巨大差异在大量的文章中被描述,这些文章显然被忽视了。例如,Scand J clinical Lab Invest最近发表了两篇文章[11,12]。

结论

  1. GUM并没有提供一种新的有用的工具来描述和理解临床生化分析方法的性能。相反,GUM认为不同类型的错误(精度和准确性)是相同的。
  2. 随着GUM的使用,我们失去了一种区分偏差和不精确的差异化操作工具,因此错误检测很容易,两种错误的影响很明显。
  3. GUM引入了一系列未解决的问题,主要是通过将未知(未测量的)偏差描述为不确定性。
  4. GUM会导致临床使用和实验室检测的解释错误。未知偏差,这是引入每一批试剂盒,是由GUM解释为标准偏差或变异系数。因此,错误对临床结果的影响被低估,这可能对实验室数据的临床解释是危险的。

总之,GUM不仅是多余的,而且是危险的,因为根据GUM来解释数据可能会扭曲生化结果,从而扭曲临床结果。

参考文献

  1. 测量不确定度表示指南。ISO:日内瓦,1995年。
  2. Kristiansen J.临床化学测量不确定度评定的一般适用模型的描述。临床化学医学实验室2001;39:920-31。
  3. m, van Uytfanghe K, de Leenheer AP.临床化学参考测量系统。临床化学学报2002;323:73 - 87。
  4. http://www.furst.no/norip/
  5. Hyltoft Petersen P, Stöckl D, Westgard JO, Sandberg S, Linnet K, Thienpont L.随机误差与系统误差的组合模型。不同模型的假设和结果。临床化学检验医学2001;39:589 - 95。
  6. 框G, Luceño A.监测和反馈调节的统计控制。John Wiley & sons, INC,纽约-奇切斯特-温海姆-布里斯班-新加坡-多伦多1997
  7. 刘建平,Stöckl D,Kratochvila J, Friedecký, Budina M.体外诊断医疗器械上市后警惕性的外部质量评价调查及参与者结果的真实性调查。临床化学实验室医学2003;41:183-6。
  8. A.基于测量不确定度的质量规范。中华临床医学杂志1999;59:513-6。
  9. Linko S, Örnemark U, Kessel R, Taylor PDP。常规临床化学测量不确定度的评定。血清中钙和葡萄糖物质浓度测定的应用临床化学实验室医学2002;40:391-8。
  10. Jørgensen LGM, Stahl M, Brandslund I, Hyltoft Petersen P, borchjohnsen K, de Fine Olivarius N.低危人群血糖参考区间的研究[j]。世界卫生组织和美国糖尿病协会新建议对糖尿病诊断的影响。中华医学杂志2001;61:181 - 190。
  11. Hyltoft Petersen P, Fraser CG, Kallner A, Kenny D(编辑)。制定检验医学全球分析质量规范的策略。中华临床医学杂志1999;59:475 - 585。
  12. Hyltoft Petersen P, Brandslund I, Jørgensen LGM, Stahl M, de Fine Olivarius N, Borch-Johnsen K.空腹血糖测量的系统和随机因素评价作为糖尿病诊断分析质量规范的基础。3.世界卫生组织和美国糖尿病协会新建议对糖尿病诊断的影响。中华医学杂志2001;61:191 - 204。
Joomla SEF url由Artio提供