医疗保健实验室的工具、技术和培训

基本方法验证

概率分析,第一部分

确定检测限可能是一个挑战。这是关于如何做到这一点的讨论的第一部分。

概率分析1:确定检测限的实际应用

James O. Westgard, Sten A. Westgard
2020年8月

在评估提供二元结果的定性测试的性能时,准确性是通过临床一致性实验来评估的,该实验将新测试的结果与已建立或批准的比较测试进行比较,或者通过与临床诊断(疾病或无疾病)进行比较。关于临床一致性研究和确定临床敏感性(Se)、临床特异性(Sp)的数据分析,以及对感兴趣人群中疾病预期患病率的测试的预测价值,已经写了很多。CLSI提供了一份共识文件(EP12-A2),描述了进行临床协议研究的良好实验室实践,包括分析实验数据的详细指导[1]。

EP12还描述了描述二元结果分类不确定性的“不精确曲线”或“不精确区间”特征的复制实验。分类是基于一个截止值(CO),该截止值可以设置在检测极限(LoD)以最大化Se,或者稍高一些以最大化Sp,但可能会损失Se。考虑到Se和Sp依赖于LoD或CO, LoD或CO的验证对于定性测试的性能表征至关重要。

查看更多关于COVID-19实验室挑战的故事…
新冠病毒覆盖率:westgard320x50

在这个COVID-19时代,随着许多用于诊断的新分子测试和用于监测的抗体测试的快速引入,FDA根据制造商提供的最少验证数据授予紧急使用授权(EUA),以证明其性能声明。这使得实验室有更多的责任通过验证他们自己的临床协议研究的准确性和他们自己估计的LoD或CO的准确性来确保这些新测试和方法的质量。

文献中有很多关于评估临床一致性研究的准确性的讨论和指导,但通过表征不精确曲线和/或截止区间来评估精度的讨论和指导较少。CLSI在EP12-A2文件中解决了这两个问题,并提供了另一个关于检测限确定的共识文件(EP17-A2)[2]。

LoD的估计

对于定量测试,检测限(LoD)可以通过重复分析两个样品来确定。首先,对空白样本进行20次重复分析,根据均值和SD计算空白限(LoB),如下:

平均黑色+ 1.65 sd黑色

接下来,为低阳性样本(即平均值)确定20个重复pos和SDpos,计算出检测限(LoD),如下所示:

LoD = LoB + 1.65 SDpos

这种方法假设了一个连续的测量尺度,它可能可用,也可能不可用于定性测试。对于ELISA免疫测定,通常存在内部连续反应(ICR),通过将反应信号与截止点进行比较,将其转换为二值结果。对于简单的线性流动装置,这样的响应通常是不可用的,在这种情况下,需要不同的实验方法。在截止点附近对三个或更多溶液进行重复测量。截止点处的浓度描述为C50,其中一半的测量值预计为正,一半为负。在临界值的低侧,浓度为C5的复制实验将导致20个重复中有1个阳性(1/20=5%)。在截止值的高侧,C95浓度应产生19/20的阳性(19/20=95%)。

下图说明了在LoD等于CO的情况下,具有连续响应(上半部分)的测试与仅具有二进制输出(下半部分)的测试的对比。

2020年概率11

对于具有连续响应的测试,确定空白样本和低阳性样本的均值和SDs,并根据上述方程计算LoD。对于二元结果的检验,确定C5、C50和C95浓度下重复测量的阳性比例,以表征累积概率分布。

这里的重要思想是,累积概率分布为从实验确定的不精确曲线评估测试的不确定性提供了另一种方法。不是通过分析重复来确定平均值和标准差,而是通过分析重复来确定阳性比例、阳性率、检出率或“命中率”。然后,这些结果表征了累积分布,该分布描述了在截止极限处患者分类的变化或不确定性。

对于核酸扩增试验(NAAT),由于空白溶液没有变化,只能得到零结果,因此无法应用传统的空白测量方法。因此,通常的方法不是估计不精确曲线的C50,而是直接从命中率估计C95,或者从观察到的命中率与表征不精确区间的测试溶液浓度的概率回归估计C95。

概率单位分析

这种类型的统计分析对许多临床实验室科学家来说是新的,但自20世纪40年代以来,它已被用于农业生物分析,以表征剂量反应曲线。经典的技术可以在d.j. Finney于1947年出版的书中找到[3,概率分析- s型响应曲线的统计处理]。该方法用于毒理学应用,例如,确定杀死昆虫所需化学品的剂量。实验方法通过增加杀虫剂的剂量来确定“杀虫率”(杀死昆虫的比例),然后将这些比例转换为“概率”,即与正态分布中标准偏差的数量相关的“概率单位”。该模型是s形或s型曲线,对应于正态分布的累积概率,如下图所示,其中概率或命中率(今天与杀伤率相关的常用术语)与标准化正态偏差SD绘制。

2020 probit 12

这个想法是将比例转换为SD尺度上的概率单位。为了使概率单位为正以方便数学计算,概率标度在标准偏差数上加上5的值。probit为5.0对应C50的中点或浓度,6.64对应C95, 3.36对应C5。比例或命中率到概率的转换可以使用Finney提供的表格(见下文),或通过Excel函数5+NORMSINV(P)进行,其中P是从原始数据中计算出来的比例或命中率。

2020概率1

根据EP17-A2进行概率回归

线性化s形不精确曲线的目的是使模型(在这种情况下是一条直线)能够与显示概率与浓度的数据相拟合。如果可以在C95上确定测试解决方案,那么直接从命中率估计LoD就足够简单了。然而,考虑到LoD并不确切,更实用的方法是分析一系列浓度,对这些数据点拟合一条线,然后计算/预测C95浓度。

EP17-A2[2,第23页]提供了一个描述性示例,如下所示。

2020 probit 14

关于这个例子的一些评论:

  • 该数据描述了一个NAAT测试,其中s形曲线的底部没有表示,因为空白或零浓度没有变化。
  • 使用的probit只是SD的数量,包括正负,而不是芬尼的probit刻度,其中所有值都是正的。
  • 概率回归使用x轴浓度的对数变换。这是评估剂量-响应曲线的常用转换,通常用于估计naat的LoD。
  • 对LoD的C95浓度的估计是通过首先预测log10值为1.56得到的,然后必须将其转换回浓度为36.5。

重建的例子

下面是一个试图重构EP17-A2示例的数据表。浓度可能是正确的,因为它们以逻辑和有序的方式进行。为了便于计算,将总重复数(Ntotal)设置为100,允许阳性数(Npos)通过从命中率与浓度图中读取的比例来近似。Probit通过Excel函数[5+NORMSINV(P)]计算,其中P为比例列中的单元格编号。

2020概率15

回归斜率为2.062,y轴截距为3.353。为了计算C95,使用了6.64的probit值(1.64为95%极限,+5为probit scale),从而给出了LoD的估计值39.2。相比之下,CLSI的答案是36.5,考虑到所有数据点都是通过从图表中估计重建的,这个答案相当接近。

为了判断拟合回归模型的数据的可靠性,查看图表是有用的[见下文]。在本例中,有10个数据点提供可靠的回归,但在实践中往往更少。EP17-A2建议在C10和C90之间至少有3个数据点,一个接近C95,另一个在C5和C95范围之外。数据点数量有限是发表研究的真正限制之一。另一个原因是缺乏图形证据表明回归模型能够很好地拟合数据。

2020概率16

一个真实的例子

造父变星Xpert Xpress SARS-CoV-2检测的性能由8个实验室进行多中心研究,其中5个在美国,1个在法国,1个在意大利,1个在英国[4]。

病毒库9.75 x 105斑块形成单位(PFU/mL)来自德克萨斯州加尔维斯顿的德克萨斯大学医学分支虫媒病毒参考库。检测限度是通过将SARS-CoV-2病毒稀释到阴性NPS临床基质中,在估计LoD范围0.0200至0.0001 PFU/mL附近的7个不同水平来确定的。每个水平至少检测22个重复,包括阴性。采用概率回归分析估计LoD。通过将SARS-CoV-2病毒刺入阴性NPS临床基质中,验证LoD值与先前通过Probit回归分析确定的估计LoD值一致。在SARS-CoV-2浓度为0.005 PFU/mL时,至少进行了22次重复的LoD验证,阳性率≥95%。在LoD水平为0.01 PFU/mL的22个阳性重复中,22/22(100%)报告阳性结果。

2020 probit 17

这是一个很好的研究,在有用的概率范围内提供了5个数据点。根据结果,probit回归给出了LoD的估计值为0.005 PFU/mL,下一个最高浓度为0.01 PFU/mL的命中率为100%。下面是概率图。

2020 probit 18

由回归线计算得到log C95值为-1.990,对应于0.010 PFU/mL的浓度。如果去掉最低点,则probit回归可以更好地拟合剩下的4个数据点,其斜率为2.903,截距为13.1。这为log C95提供了-2.240和LoD的0.006 PFU/mL的估计值。这些差异可能很小,但它们揭示了结果的可变性,即使对于一个在概率范围内提供几个数据点的好研究来说也是如此。最有可能的概率回归被限制在只有4个数据点,以提供0.005 PFU/mL的估计值。

另一个CLSI示例

CLSI还在附录C[2,第51-53页]中提供了一个“工作示例”。这个例子显示了一个包含6种不同浓度的初始研究,但结果只有2种非零或非一命中率。根据对这些结果的回顾,我们分析了两个额外的水平,以提供总共4种具有有效命中率的浓度,如下表所示。

2020年概率19

检查实验结果以确保足够数量的浓度的重要性是正确应用概率分析的重要教训。

绘制这些点的图表对于证明它们对估计C95的有效性也很重要。

2020年概率1 10

由于对数为负,图表看起来有点奇怪,尽管如此,我们可以计算斜率(2.088)和截距(9.136),然后计算对应于probit为6.64的log C95值(-1.195),最后将该对数转换回浓度值0.064 CFU/mL。

为了进行比较,下面是CLSI工作示例的结果,其中“使用概率分析软件重新分析数据”。这里我们有一个完全不同的回归模型,它将数据拟合到s形的s型曲线上,而不是转换为概率,然后提供线性拟合。CLSI对这个工作示例的回答是LoD为0.077 CFU/mL。考虑到方法上的差异,0.064 CFU/mL的经典probit回归的答案实际上与软件的答案非常吻合。然而,作为一个有效的例子,它不是很有帮助,除非你碰巧知道什么软件被使用,并且碰巧有访问该软件。相反,这个例子说明了为什么概率分析的质量可能如此多变,即使是好的实验室实践的共识指南也没有提供包括数据分析本身的标准化、详细、可行的程序。

2020 probit 11

这种类型的概率分析已经由Vaks[5],他是EP17文件委员会的成员进行了更详细的描述。这种新的数学模型的优点是数据拟合得更好,置信区间更紧,估计更好,重复次数更少,需要测量的浓度更少。根据Vaks的说法,由于该模型拟合低检测率为0和高检测率为1.0的点,因此可能需要在两者之间的范围内少于3个点。新模型与SAS PROC PROBIT的结果进行了比较,SAS PROC PROBIT是市面上最强大的统计软件包之一。新方法的软件由加拿大滑铁卢的Maplesoft公司开发并拥有版权。[在谷歌上搜索Vaks probit analysis可以找到这篇论文。]

有什么意义?

概率分析是确定分子方法LoD的推荐方法。不幸的是,没有应用概率回归的一致实践,甚至在CLSI EP17-A2文档中也没有。这意味着对LoD的估计可能不可靠,即使在建立市场上方法的相对灵敏度所需的头对头比较中也是如此。

改进是可能的!首先,实验室应强调收集更好的数据,确保至少4种检测浓度提供有用的线索。其次,实验室可以使用Excel电子表格并应用函数5+NORMSINV(P)将命中率转换为芬尼的probit值,而不是诉诸于更复杂和可能专有的统计程序进行数据分析,从而实现经典的芬尼方法。如果你收集了可靠的数据,你的实验室里有人有能力做这件事,可以提供可靠的数据分析。可靠的数据是提高对LoD估计的关键。

最后,如果Excel方法不实用,您可以下载对数正态概率图纸[6]并手工执行这些示例,直接绘制命中率与浓度的原始数据。让坐标纸完成所有将其转换为对数和对数的工作。你只需要画出点,然后用尺子在数据中画出最好的直线。下载包括4张可打印的表格,分别用于x轴上的1、2、3和4个日志周期。从带有10个数据点的第一个EP17示例开始,并使用1周期图纸。对于接下来的2个例子,使用2循环曲纸并适当缩放x轴。这种方法有点老派,但你可能会对它的效果感到惊讶。而且你无法战胜成本。

参考文献

  1. CLSI EP12-A2。定性测试性能评价用户协议。临床和实验室标准研究所,西谷路940号,1400室,韦恩,宾夕法尼亚州,2008年。
  2. CLSI EP17-A2。临床实验室测量程序检测能力的评价。临床和实验室标准研究所,西谷路940号,1400室,韦恩,宾夕法尼亚州,2012年。
  3. 芬尼DJ。概率分析:s型响应曲线的统计处理。剑桥大学出版社,剑桥和伦敦,1947年。
  4. 4.罗菲霍兹m ., Alland D ., Butler-Wu SM .,等。造父变星Xpert Xpress SARS-CoV-2检测的多中心评价https://doi: 10.1128 / JCM.00926-20。
  5. 卡拉若我。分子诊断学检测限评价的新方法。联合统计会议,加拿大温哥华,2018年7月28日至8月2日。[谷歌搜索Vaks概率分析应该给出Maplesoft.com来源]
  6. 对数正态概率绘图纸,1,2,3和4个周期。https://weibull.com/GPaper/
Joomla SEF url由Artio提供