医疗保健实验室的工具、技术和培训

基本方法验证

定性测试的临床一致性评估:2x2应急表的网络计算器

如何验证定性测试?这是一个小工具的介绍,你可能会发现有用的病毒分析验证

定性测试的临床一致性评估:2x2应急表的网络计算器

詹姆斯·韦斯特加德,帕特里夏·加勒特,保罗·席林
2020年4月

在Covid-19大流行期间,为医学实验室提供一些支持,以验证定性测试,可能会有所帮助。对病毒进行rRNA-PCR检测和对SARS-CoV-2抗体进行血清学检测的大型实验室可能可以使用遵循FDA和CLSI建议的统计程序进行方法验证。较小的实验室不太可能有这些程序,但随着更简单或更自动化的方法的出现,仍然需要进行一些最低限度的验证或验证研究。

需要明确的是,有两种新的检测方法:(1)对SARS-CoV-2病毒本身的检测,以及(2)对该病毒抗体的检测。每一种标记物现在都在用多种方法进行分析,这些方法正在FDA根据紧急使用授权(EUA)快速批准。检测病毒的方法大部分(但不是全部)基于聚合酶链反应,而检测抗体的方法基本上都属于血清学检测的范畴。PCR和其他核酸或分子方法通常在实验室的一个区域进行,根据这些技术的仪器已经建立。血清学测试通常在实验室的另一个部门进行。随着简单侧流测试的引入,在护理点情况下也将进行测试。所有这些测试都是定性测试,这意味着它们有一个医学决策点(截止点)来将结果分类为阳性或阴性。

查看更多关于COVID-19实验室挑战的故事…
新冠病毒覆盖率:westgard320x50

经CLIA批准进行中等和高度复杂测试的实验室有资格实施经紧急使用授权(EUA)批准的制造商测试。仍然必须进行验证研究,并且每次分析患者样品时都应分析阳性和阴性QC样品[1]。

临床一致性研究

为了验证,FDA建议进行“临床协议研究”,以及检出限(LoD)和交叉反应性研究。我们在这里关注临床一致性,这通常涉及比较两种不同方法的结果。FDA声明可以使用“人造临床标本”,这意味着可以接受用高水平的对照材料(最好是非活性的)添加样品。FDA建议使用30个反应性样本(20个低反应性样本在LoD的1到2倍,10个高于测试范围)和30个非反应性样本。FDA还要求前5例阳性和前5例阴性的真实患者结果通过先前授权的EUA方法确认。

CLSI EP12-A2文件[2]提供了将新的“候选”测试方法与可用的“比较”测试方法进行比较的指导。我们预计,大多数实验室将有机会获得已经由其所在地区的另一个实验室分析过的测试标本,这些实验室可能是其医院网络使用的参考实验室,也可能是用于发送的更大的高复杂性测试实验室。或者,实验室可以分析来自记录的感染患者和来自未感染患者的标本。

2x2列联表数据分析

在一项比较研究中,候选试验和比较试验的结果被分类为阳性或阴性,这些结果可以总结如下:

a =两项检测均为阳性的结果数;
b =候选方法为正,但比较结果为负的结果数;
c =候选方法为负,但比较结果为正的结果数;
d =两种方法都为负的结果数。

然后可以将这些结果总结为2x2列联表,有时称为“真值表”。

比较方法
候选方法(测试) 积极的 总计
积极的 一个 b A + b
c d C + d
总计 A + c B + d n

性能特性计算

这个表格提供了计算的基础正面协议(PPA)百分比、负面协议(PNA)百分比和整体协议(POA)百分比,如下:

PPA = [a/(a+c)]*100

PNA = [d/b+d))]*100

POA = [(a+d)/n]*100

理想情况下,PPA和PNA应该是100%,如果b和c的数字为零,就会出现这种情况。较低的值代表较不理想的性能,因此这些对PPA和PNA的估计可能对判断候选方法的可接受性有用。POA用处不大,因为即使PPA或PNA可能很低,POA也可能很高。【注:如果比较法是诊断分类的“金标准”,则PPA被认为是候选方法的“诊断敏感性”,PNA被认为是候选方法的“诊断特异性”,POA有时被称为“效率”。】

为了解释这些计算出的特征,知道它们的近似置信区间,即这些数字的可靠性,应该是有帮助的。请参阅附录了解如何计算这些置信限。

比较方法
候选方法(测试) 积极的 总计
积极的 285 15 300
14 222 236
总计 299 237 536
95%置信区间
摘要统计信息 百分比 Lo限制 嗨,限制
积极协议PPA 95.3% 92.3% 97.2%
消极协议PNA 93.7% 89.8% 96.1%
全面协议POA 94.6% 92.3% 96.2%

对于此处显示的示例[摘自EP12-A2,第30-31页],PPA估计为95.3%,可靠地介于92.3%和97.2%之间。PNA估计为93.7%,可靠度在89.8%至96.1%之间。虽然我们计算出POA为94.6%,95%置信区间约为92.3%和96.2%,但这一特征并不那么有用,在判断可接受性时不需要考虑。

请注意,对于样本数量较少的情况,预期置信限会很宽。例如,5阳性5阴性,无假阳性或假阴性,则下限约为57%;10个阳性和10个阴性的下限约为72%;30岁,约89%;40岁,约91%;50岁时,约93%。所有这些限制都是针对完美匹配的比较。测试的样本数量越少,即使有一个不匹配(假阳性或假阴性),信心下降就越深。[参见35页EP12-A2中的表A1]。这说明了FDA建议累积至少30个阳性和30个阴性结果以达到最低可靠估计的原因。

Westgard QC 2x2应急计算器

http://tools.westgard.com/two-by-two-contingency.shtml

该计算器要求用户在列联表中输入对应于a(真阳性)、b(假阳性)、c(假阴性)和d(真阴性)的4个数字。然后点击“计算”按钮,获取正面协议(PPA)、负面协议(PNA)和总体协议(POA)的汇总统计数据,以及它们的95%置信区间的下限和上限。要查看本课讨论的示例,请单击“加载示例数据”。打印页面以提供结果的文档。

[保罗·佩雷拉博士关于定性测试验证的更详细的课程可以在这里找到。]

参考文献

  1. 美国卫生与公众服务部美国食品和药物管理局在突发公共卫生事件期间对冠状病毒病-2019诊断测试的政策:对临床实验室、商业制造商和食品和药物管理局工作人员立即生效的指导。2020年3月16日。https://www.fda.gov/media/135010/download
  2. 张建军,张建军,张建军,等。定性测试性能评估用户协议。临床和实验室标准研究所,西谷路940号,1400室,韦恩,宾夕法尼亚州,2008年。

关于Patricia E. Garrett博士

帕特·加勒特于1970年获得有机化学博士学位,1978年,在完成了五个博士后后,她开始了在波士顿地区医院指导实验室的临床实验室生涯。1988年,她开始在一家小型初创公司从事传染病诊断质量控制和标准方面的工作,并帮助这家公司在24年的时间里通过两次收购实现了增长。从2013年到现在,她一直担任顾问和首席研究员,NIH资助由另一家波士顿小公司持有。她的热情是帮助临床实验室和诊断制造商“做对”。

附录:置信限的计算

这些计算并不难,但有点混乱。它们分为两个阶段进行描述,首先从表中计算一些数量(Qi),然后从这些q中计算上下限置信限。[CLSI EP12-A2第23-25页描述]

PPA置信限的计算

Q1 = 2a + 3.84

Q2 = 1.96*[3.84 + 4a*c/(a+c)]1/2

Q3 = 2(a+c) + 7.68

PPA下限= 100*(Q1-Q2)/Q3

PPA极限= 100*(Q1+Q2)/Q3

接下来,对PNA进行类似计算。

Q4 = 2d + 3.84

Q5 = 1.96*[3.84 + 4bd/(b+d)]1/2

Q6 = 2(b+d) + 7.68

PNA下限= 100*(Q4-Q5)/Q6

PNA极限= 100*(Q4+Q5)/Q6

最后,对POA进行类似的计算。

Q7 = 2(a+d) + 3.84

Q8 = 1.96*[3.84 + 4(a+d)(b+c)/n]1/2

Q9 = 2n + 7.68

POA下限= 100*(Q7-Q8)/Q9

POA上限= 100*(Q7+Q8)/Q9

Joomla SEF url由Artio提供