医疗保健实验室的工具、技术和培训

客人的文章

是时候进行测量不确定度了

在实验室正在进行的“口水战”中,是时候听到另一个声音了。来自大西洋彼岸的专家Dietmar Stockl博士为我们提供了一篇详细的文章,解释了测量不确定度如何对实验室有用,甚至与完全误差共存。

2008年9月

迪特马尔Stockl
STT咨询
亚伯拉罕·汉斯特拉特
B-9667霍雷贝克,比利时
电子邮件:此电子邮件地址被保护免受垃圾邮件机器人。您需要启用JavaScript才能查看它。

介绍

由于随机效应和系统效应的影响,测量结果本身是可变的。这种可变性必须量化,以便结果的使用者了解其可靠性。测量不确定度表达指南[1]提供了量化测量变异性的一般规则。由GUM规则量化的测量变异性称为测量不确定度(定义参见方框1)[23.])。由于对GUM的真正含义和对GUM的许多个人解释感到困惑,因此通过使用原始的GUM引文(用“引号”和段落编号表示)来介绍这个概念。

guest41box1

GUM概念的一个最重要的方面是“假设测量的结果已经针对所有公认的重要系统影响进行了修正,并且已经尽了一切努力来识别这些影响”(3.2.4)。然而,“由于随机效应和对系统效应结果的不完善校正所产生的不确定性,对已确认的系统效应进行校正后的测量结果仍然只是对测量值的估计”(3.3.1)。因此,“一般来说,测量的结果只是被测量值的近似值或估计值,因此只有在附有该估计值的不确定度声明时才是完整的”(3.1.2)。测量不确定度由两种不同的方法评定;“A类:通过一系列观测数据的统计分析评估不确定度的方法”(2.3.2);“B类:不确定度的评定方法,不采用对一系列观测值进行统计分析的方法”(2.3.3)。“B型是根据所有关于测量值可能变化的可用信息进行科学判断的。信息库可能包括i)以前的测量数据;Ii)对相关材料和仪器的性能和特性有一定的了解或经验;Iii)制造商的规格; iv) data provided in calibration and other certificates; v) uncertainties assigned to reference data taken from handbooks” (4.3). “The purpose of the Type A and Type B classification is to indicate the two different ways of evaluating uncertainty components and is for convenience of discussion only; the classification is not meant to indicate that there is any difference in the nature of the components resulting from the two types of evaluation. Both types of evaluation are based on probability distributions, and the uncertainty components resulting from either type are quantified by means of variances or standard deviations” (3.3.4). Note, “these categories are not substitutes for the words random and systematic” (3.3.3). “Type A uncertainty is obtained from a probability density function derived from an observed frequency distribution, while Type B uncertainty is obtained from an assumed probability density function based on the degree of belief that an event will occur” (3.3.5). It should be stressed that “the definition of uncertainty of measurement is not inconsistent with other concepts of uncertainty of measurement, such as a measure of the possible error in the estimated value of the measurand as provided by the result of a measurement. Nevertheless, “whichever concept of uncertainty is adopted, an uncertainty component is always evaluated using the same data and related information” (2.2.4). See Box 2 for a summary of the GUM concept.

guest41box2

测量不确定度的计算(改编自NIST网站)

注意:前方有重物。如果您愿意,请继续下面的内容。

在开始不确定度计算之前,必须定义测量方程。通常,量Y(称为被测量量)不是直接测量的,而是由N个其他量X确定的1, X2……, XN通过一个函数关系f,通常被称为测量方程: Y =f(X1, X2……, XN).包含在数量X中校正(或校正因子),以及其他可变性来源,如不同的观测者、仪器、样品和抽样、实验室和进行观测的时间。因此,函数f上面的方程不仅应该表达一个物理定律,而且应该表达一个测量过程,特别是,它应包含所有可能对测量结果造成显著不确定度的量.对测量值的估计输出量Y,记为Y,由上式使用输入估计x得到1, x2……, xN求N的值输入数量X1, X2……, XN.因此,输出估计Y (= result)由Y = f(x)给出1, x2……, xN).测量结果y的不确定度来自于不确定度u(x))(或)的输入估计值x这就进入了等式。测量结果y的组合标准不确定度,用u表示c(y)是估计方差u的正平方根c2(y)从


guest41fig1

这个方程是基于测量方程的一阶泰勒级数近似,被称为不确定性传播定律.的偏导数f通常被称为s精确度的系数和u (x, xj)是与x相关的协方差和xj.的偏导数f关于X等于的偏导数f关于X在X处求值= x;u (x)是与输入估计x相关的标准不确定度请注意A类的标准不确定度等于通常在实验室估计的标准差(u(x))) = SD(x))。的概率分布y和它的联合标准不确定度ucy)近似正态(高斯),则区间y±ucy)应包含可合理归因于Y的约68%的值(Y=y±ucy))。如果需要其他置信水平,则可以扩大标准不确定度(扩展不确定度: U = k Uc)覆盖率, k(例如,2或3:近似置信度为95或>99%)。

GUM不确定度计算可以根据需要进行复杂的计算。我在这里只展示“轻量级”版本。最后,给出了一种利用现有数据估计测量不确定度的实验室方法。

但是,如果需要进行深入的GUM计算(制造商;内部方法开发人员),建议咨询互联网资源并购买口香糖。

GUM计算“轻量级”

简而言之,GUM是关于标准偏差/方差的传播。这也是标准临床化学教科书的一部分[4]。错误传播的两种最简单的情况将被解决,即求和和乘法/除法(两者遵循相同的规则)。

1.测量值由函数y = a + b描述;SDa = 5, SDb =10

u(y) = SQRT(5x5 + 10x10) = SQRT(125) = 11.2;SQRT =平方根

洞:使用测量a和b的方法的CV值。

2.测量值由函数y = a/b描述;

a = 70, b = 40 (y = 70/40 = 1.75), SDa = 5 (CVa = 100*[5/70] = 7.1%), SDb =10 (CVb = 25%)

u(y) =yx√(5/70)2+ (10/40)2) =1.75 x 0.26 = 0.455 (= 26% y =1.75)

注意,相对方差是传播的;因此,简历可以使用:

u(y) (%) = SQRT([7.1]2+ [25]2) = 26%(1.75的26% = 0.455)

这些方程可用于计算阴离子间隙和肌酐间隙的不确定度。

guest41box3

应用程序[参见4

阴离子间隙(AG)

AG = ([Na+]+[K+]) - ([Cl-]+[HCO3-])

在日常练习中,钾经常被忽略,留下这样的等式:

AG = ([Na+]) - ([Cl-]+[HCO3-]) mmol/L

例如:AG = 140 - (106 + 22) = 12 mmol/L

SD[Na+] = 1.3 mmol/L;SD[Cl-] = 1.2 mmol/L;SD[HCO3-] = 0.7 mmol/L

Sd [ag] = sqrt (1.32+ 1.22+ 0.72) = 1.9 mmol/L

这个值等于阴离子间隙的标准不确定度:

u(AG) = 1.9 mmol/L;使用2的覆盖因子(约95%的概率),扩展不确定度为U = 3.8 mmol/L。这相当于在没有系统误差(SE)的情况下,总误差(TE)计算为随机误差(RE)的2倍:TE = 2 x RE。

肌酐清除率

Ccr = (U × V)/S mL/min

肌酐清除率(Ccr);毫升/分钟);尿肌酐(U;µmol / L);尿量/分钟(V;毫升/分钟);血清肌酐(S);µmol / L)

CV(U) = 3%;Cv (v) = 10%;Cv (s) = 3%

CV(Ccr) = SQRT(3)2+ 102+ 32= 11%

在Ccr为80 mL/min时,u(Ccr) = 8.8 mL/min (= 80 mL/min的11%)

那么,为什么对GUM大惊小怪,这没什么新鲜的?

虽然GUM计算可能很简单,但GUM的理念鼓励分析人员查看“输入数据背后的内容”,特别是要解决B类不确定性。例如,阴离子间隙的问题在于,它可能随着仪器的不同而变化很大。因此,所涉及的测量程序必须正确地标准化,并使用正确的参考区间来解释其含义(56).下面的例子延续了这一思路。

使用现有数据的实验室方法

的测定

被测变量:血清/血浆睾酮;物质量浓度(nmol/L)

预期用途免疫分析法用于人血清和血浆中睾酮的体外定量测定。

临床应用(选择)

女性:诊断雄激素综合征,多囊卵巢,肿瘤。

男人:怀疑睾酮分泌减少(性腺功能减退,雌激素治疗)。

测试原理竞争性分析:2孵育,分离,洗涤,检测,清洁。

主校准:商用睾酮(无主要参考物质),采用5点校准曲线(样条函数)。

校正基于方法比较同位素稀释质谱参考程序使用40本地血清,但没有实施。原因:有临床误解风险;等待着国际标准化。

客户校准2分,每批新试剂。

校准如果实际使用时间更长,则为14天;同一批次使用2个月。

质量控制: 2个级别,每天1次(规则和验收标准由用户定义)。

制造商给出的不确定度guest41fig2

guest41fig3

检讨资料

实验室意识到制造商的不确定度估计不包括以下数据:

  • 真实,
  • 样品相关效应(矩阵;干扰),
  • 对线性度、回收率、方法可比性的影响
  • 低雌性浓度的不确定性,
  • 校准器和试剂的稳定性。

实验室决定从制造商的技术文件和科学文献中获得额外的信息。

来自制造商技术文档的信息

分析特异性 交叉反应性数据,但没有迹象表明它们与患者标本的相关性。
干扰 干扰限10%(脂类等的浓度)。对普通药物无干扰。
线性 限制10%
复苏 限制10%
方法比较 可接受坡度:0.9 - 1.1
检测限(LoD) 0.1 nmol / L
定量限(CV = 20%) 0.4 nmol / L
可报告范围范围(从LoD到校准最大值) 0.1 - 60nmol /L
预期值

男性:10 - 28 nmol/L
女性:0.2 - 3nmol /L

稳定性数据校准器和试剂批次 在建议的最大时间内(没有给出限制)有些下降。
批对批标准、校准器和试剂 没有相关信息。


guest41fig4

科学信息

查阅了科学文献后发现,样本相关的影响有相当大的风险,尤其是对女性(7).抗体干扰的发生率似乎很低(89),而由交叉反应引起的干扰似乎更为常见(10-12).需要考虑的干扰是脱氢表雄烯二酮硫酸盐和睾酮偶联物。

使用上述所有信息估计测量不确定度的实验室方法

实验室可以对不精确数据进行验证,但决定通过以下方式修改制造商的不确定度估计:

  • 将不确定性“点”估计转换为区间,并加入一个区间;
  • 低范围内的估计值因样品相关效应而扩大,并考虑到测定的定量极限(总效应:因子2);
  • 通过样本相关效应(按总不精度的顺序)扩大中低范围的估计值,并对不精度进行内插;
  • 在所有范围内增加了5%的不确定度,以考虑回收率和线性;
  • 工作范围下限提高到0.25 nmol/L(检出限与定量限相差较大)。
  • 对干扰进行了风险分析,并制定了政策。
  • 与制造商讨论了正确性问题,并接受了他们的理由。
  • 实验室在其文件中保存了以下不确定度估计。

guest41fig5

除了口香糖

长期的内部质量控制数据表明,批次之间的差异比较大(u = 10%)。实验室通过引入偏差进行了总误差计算和模拟。研究发现,10%的偏差会使“需要采取行动”的结果改变50%。虽然这个数字被认为太高,但没有找到解决办法。实验室加大了质量保证力度,并以更大的力度推行了质量控制制度。

guest41box4

口香糖的局限性

如上所述,偏差不包括在GUM计算中,但需要纠正。然而,偏差的处理(现有的或输入的总误差模型)是至关重要的实验室。例如,调查试剂批次对患者数据变化的影响。下面的图1显示了批对批CVbb为10%(值为100时= 10)和批内CVwb为5%的测试。它是通过模拟20个随机数字生成的,SD为10,平均值为100。然后,对于20个值中的每一个(批均值用条形表示),模拟20个随机数,SD为5。该图将表示一个批次持续20天,每天做一个QC样品所获得的质量控制数据。进一步,假定稳定过程的平均值已知为100。

guest41fig6

根据GUM的说法,存在两种可能性。如果将观察时间延长到所有20批次,则单个批次的偏差变得随机,总CVtot变为11.2%。实验室可以决定在其文件中保留该工艺的不确定度为11.2%,而不考虑更换试剂批次时引入的偏差。然而,这会给测试性能一个错误的印象,因为每个试剂批次的偏差可能会对诊断决策产生深远的影响(13).如果观察时间为2批,则不时会看到相当大的系统效应(例如第2批)。这就是为什么GUM不赞成区分“随机”和“系统”的原因:它可能取决于观察时间。根据GUM,第二批修正后的平均值为120(偏差= 20%)。然而,实验室通常无法纠正批与批之间的差异。然而,它需要知道20%的偏差对患者结果的影响。例如,如果这种偏差会使误报增加50%,则可能需要制造商收紧其批次到批次的变化。此外,为了选择合适的质量控制规则,实验室需要一个考虑偏差的模型。例如,这种模型就是Westgard软件产品中使用的总误差方法。

与GUM哲学相反,实验室区分随机效应和系统效应是至关重要的。当必须考虑系统效应时,必须使用其他概念来描述测量变异性,例如总误差概念。因此,在我看来,不同的概念是互补的,而不是矛盾的。然而,单独的GUM不足以管理临床实验室中的实际情况。

guest41box5

关于质量控制的说明

上面的例子显示了质量控制的困境:实验室应该使用11.2%的CV还是5%的CV作为QC过程的输入值?如果选择11.2%的CV,典型的QC规则很少会发出警报。如果选择5%的CV,典型的QC规则将定期指出问题。但是,接下来该怎么办呢?目前,这个问题没有简单的答案。显然,为了质量控制的目的,可以改变质量控制样本的目标值,但是,这对患者样本的偏差没有任何改变。

在未来,希望制造商保持批间变化的顺序与批内变化的顺序相同。为了进行比较,图2显示了CVbb = CVwb = 5%的QC图表。总利率为7.1%。

guest41fig7

参考文献

  1. ISO/IEC指南98:1995。测量不确定度表达指南(GUM)。国际标准化组织:日内瓦,1995年。
  2. ISO/IEC指南99:2007。国际计量词汇。基本和一般概念及相关术语(VIM)国际标准化组织:日内瓦,2007年。
  3. JCGM 200:2008。国际计量词汇。基本和一般概念及相关术语(VIM)国际度量衡局(BIPM);计量指南联合委员会(JCGM):巴黎,2008年(电子文件可免费获取:http://www.bipm.org/en/publications/guides/vim.html)。
  4. Kringle RO。统计程序。在Burtis CA, Ashwood ER[编辑]。Tietz教科书临床化学,第二版,第12章,页419-422。费城:桑德斯出版社,1994。
  5. Kraut JA, Madias NE。血清阴离子间隙:在临床医学中的应用及局限性。中华临床医学杂志,2007;2(3):391 - 391。
  6. Paulson WD, Roberts WL, Lurie AA, Koch DD, Butch AW, Aguanno JJ。化学分析仪测定血清阴离子间隙的差异很大。[J]中华临床医学杂志1998;11:735- 742。
  7. Taieb J, Mathian B, Millot F, Patricot MC, Mathieu E, Queyrel N, Lacroix I, Somma-Delpero C, Boudou P.用10种免疫分析法和同位素稀释气相色谱质谱法测定116例男性、女性和儿童血清中的睾丸激素。中国生物医学工程学报(英文版);2009;33(1):391 - 391。
  8. Kuwahara A, Kamada M, Irahara M, Naka O, Yamashita T, Aono T.高促性腺功能减退症女性自身抗睾酮抗体的研究。中华内分泌杂志1998;23(3):1 -6。
  9. 王晓明,王晓明,王晓明,等。血清抗[125I]睾酮抗体的研究进展。中华临床医学杂志1996;42(2):447 - 418。
  10. 詹。脱氢表雄烯二酮硫酸盐干扰许多睾丸激素的直接免疫测定。生物化学学报(英文版);2007;44(4):391 - 391。
  11. 黄晓明,黄晓明,黄晓明,黄晓明,等。血清睾酮水平的影响因素分析。生物化学学报(英文版);2006;43(3):391 - 391。
  12. 李建军,赵晓明,李建军,李建军,李建军,李建军。直接雌二醇和睾酮免疫测定试剂盒的局限性。类固醇2003;68:1173-8。
  13. Thienpont LM。测量不确定度的计算——为什么偏差应该单独处理。中华临床医学杂志2008;44(4):1587。

互联网资源

Joomla SEF url由Artio提供