讨论如何在QC验证程序中实现多规则过程。这些答案也适用于我们最新版本的QC设计软件,EZ规则3。
还讨论了什么是“运行”,以及如何为当今的现代随机访问分析器定义它。加上病人平均数和移动平均数。(向下滚动到第一部分)
本文由LGC Technopath临床诊断公司独家赞助
分析运行,控制放置,患者平均,和移动平均
多规则在QC验证程序中的应用
QC Validator程序的一个用户提出了一些关于如何模拟和应用多规则过程的控制规则的有趣问题。
如何在功率曲线中结合不同的控制水平?
为简单起见,我们假设方法性能和分析误差在每个级别或每个控制材料上是相同的,因此所有控制测量将提供关于发生的事情的相同信息。在某种意义上,性能和误差相对于控制材料的平均值被归一化,并且被认为很像一个SDI类型的值。因此,控制规则可以被应用,就好像正在使用单个级别的控制材料,级别或材料本身无关紧要。
如果没有这些简化的假设,这个过程就会变得复杂得多,并且需要根据每一组特定的条件确定功率曲线。使用微型计算机上的QC模拟程序,每个功率曲线可能需要几分钟。考虑到各种各样的规则和感兴趣的n,生成选择适当控制规则所需的所有信息可能需要几个小时甚至一天的时间。这些条件会在一定程度上因测试而异,从而使选择QC程序的工作过于费力而不切实际。
受控物料的数量如何影响自动QC选择?
在自动QC选择过程中考虑的控制规则取决于可用的控制测量的总数,而控制测量的总数又取决于控制材料的数量。控制材料的数量设置了要考虑的控制测量的最小数量,但该数量的倍数也要考虑,通常对应于每个控制材料的测量两次。例如,对于2种材料,自动QC选择标准的默认设置考虑的总n为2和4;对于3种材料,总n为3和6。用户可以修改选择标准以消除较高的总n值。
例如,自动选择3种材料,自动选择功能将考虑2种材料2 s和31规则而不是22 s和图41规则。当总N为6时,自动选择功能将考虑6x规则而不是10x规则。
运行次数(R)如何影响控制规则的选择?
这里的R指的是应用控制规则的运行次数(不要将它与R中的R混淆)4 s指的是范围控制规则)。大多数控制规则在一次运行中应用,因此R通常为1。但是,对于多规则过程,如果总N太小,则不能在单次运行中应用某些规则。例如,13 s/ 22 s/ R4 s/ 41多规则程序,只有13 s, 22 s,和R4 s规则可以在具有2个控制测量的单次运行(R=1)中应用。如果R等于2,那么41规则可以通过将来自当前的2个控制测量与来自前一次运行的2个控制测量相结合来应用,因此,使用41规则,以回顾早期的控制数据,并改进对系统错误的检测,这些错误会在每次运行中持续存在,直到被发现和消除。
自动选择条件的默认设置R始终为1,无论控制材料的数量是1、2还是3。这意味着将只根据多规则过程在第一次运行时检测错误的能力来选择它们。但是,在第一次运行无法实现理想的错误检测的情况下,用户可以更改R的设置,以选择一个多规则过程,通过一定数量的运行来实现期望的错误检测。
在模拟功率曲线和在多规则程序中应用规则时,R的含义是什么?
在生成功率曲线时,如果总N足够,则可以在一次运行中应用的控制规则总是在当前运行(R=1)中使用。如果存在不能在当前运行中应用的规则,则如果R>1,则如果RxN足够,则将应用该规则。然而,在R=1中应用的规则不会再次应用,因为它们已经应用于之前的运行。
在将多规则过程应用于实验室测试过程时,应首先应用可在当前运行中使用的规则,以确定当前运行的控制状态,然后应用需要多次运行的任何规则,以检测单次运行中无法检测到的持久错误。
例如,如果是13 s/ 2 of32 s/ 31/ 6xN=3, R=2,采用多规则程序3 s2 of32 s,和31是否适用于单次运行中的3个对照观察和6个x规则将在运行中应用,以考虑之前的3个控制观察结果以及3个当前观察结果。如果前一次运行的对照观察值依次为+0.5SD、+2.2SD和+1.7SD,当前运行的对照观察值依次为+2.1SD、1.8SD和1.7SD,则为6x发生了违规行为。注意,因为2 / 32 s规则可以在运行中应用,并且不会违反该规则,即使在运行中出现+2.2SD, +1.7SD和+2.1SD的序列。
跨运行使用什么规则?
4等规则16x, 8x和10x通常在运行期间应用,以检测持续的系统错误。22 s和31如果有兴趣在一个水平上监测系统变化,例如工作或线性范围的高端或低端,也可以在材料内和跨运行中使用。
为什么不是R4 s跑步时使用的规则?
记住这个R4 s规则的目的是检测随机错误,而22 s规则针对的是系统错误。如果在两次运行之间发生系统变化(可能是由于校准问题),则R4 s规则将对这种系统变化以及随机误差中的任何变化作出反应。因为我们希望使用这些规则来指示发生的错误类型(这将帮助我们对方法进行故障排除),所以我们更喜欢使用R4 s只在运行中使用规则,并在运行之间使用其他规则(如22 s或41。并非所有人都同意这一点,一些分析师选择应用R4 s规则跨跑,所以一定要仔细看如何R4 s规则在你自己的实验室里被应用。
那用R呢4 s在一次运行中跨越材料?
我们确实应用了R4 s在一次运行中,即使可以说系统变化可能发生在一个级别而不是另一个级别,也不应该在原则上跨材料使用该规则,特别是如果控制限值是根据运行内SD计算的,而不是代表多次运行预期性能的更长期SD。同样,这里需要一些判断,您需要仔细定义如何在您的方法方案中应用该规则,或者仔细阅读实验室程序手册以了解其在您的实验室中的预期用途。
是R吗?4 s规则要求连续控制测量?
不,是R4 s规则用于考虑一组控制测量中的最高和最低观测值,因此不需要像2一样连续观测2 s或41规则。“连续性”有助于观察分布均值的变化,即系统误差,而随机误差是通过寻找分布的宽度来观察的,而分布的宽度更容易从一组观测值的范围中观察到。
是R吗?4 s如果一个控制是+2.4SD,另一个控制是-1.8SD,是否违反了规则?
否或是,取决于该规则是定义为定性计数规则还是定量范围规则。
多规则程序的最初应用是数测量的次数超过一定限度,因此,它是一种计数型算法。1个测量值是否超过2s极限,连续2个测量值是否超过2s极限,一组测量值是否超过+2s极限,另一组测量值是否超过- 2s极限,连续4个测量值是否超过相同的1s极限,连续10个测量值是否落在平均值的一侧?如果R4 s作为计数规则,+2.6SD和-1.8SD的观测值不代表R4 s侵犯。
如果你想更定量,更实际计算最高和最低观测值之间的差异,然后可以使用定量范围规则,如R0.05或者R0.01在这种情况下,如果N为2-4,则观察到的4.4SD范围将是违规的。这些规则通常与平均规则一起使用,平均规则是由Shewhart提出的原始QC建议,至今仍在工业中广泛使用。QC验证器包含平均/范围程序的功率曲线,如果这些程序可以在您的实验室实施,可以修改自动选择标准以选择这些程序。
另一位来自荷兰的用户提出了一系列关于如何定义分析运行、在运行中放置控制以及使用患者数据和移动平均质量控制程序的问题。
如何定义自动随机访问分析器的“运行”?
例如,一次运行可以是两个对照组之间的所有患者样本,一个完整的托盘,或一个班次。如果只有在分析了最后的控制之后才认为结果是有效的,那就有很大的不同了。
我们之前提到过一个类似的问题,并承认“这是一个棘手的问题,我们没有一个简单的答案。”这个答案仍然是正确的,但更多地讨论这个问题可能是有用的。
上述问题还意味着,run的定义包括通过对照将患者样本“括起来”的做法。重要的是要了解,bracketing的做法可以追溯到早期的连续流分析仪,不是很稳定,往往在相当短的时间内漂移,例如分析一盘样品所需的时间。标准的做法是在运行的开始——就在校准器之后——以及在样品的最后或托盘的最后,以先到的为准。如果跑到最后控制失灵,通常是由于漂移的问题。患者样本的结果从运行开始就发生了显著变化,因此,在控制之间重复样本是合理的做法。
今天的第四代分析仪具有完全不同的操作特性(参见“质量控制的未来方向”的讨论),这表明将一组样品与控制“包围”的做法可能不合适。NCCLS[文档C24-A]为定义运行提供了更好的指导。内部质量控制测试:原理和定义。国家临床实验室标准委员会,940 West Valley Road, Suite 1400, Wayne, PA[19087-1898],其中提供了以下定义:
- "分析运行:为了质量控制的目的,分析运行是一段时间(即一段时间或一系列测量),在此期间,测量系统的准确度和精密度预期是稳定的。在分析运行之间,可能会发生一些事件,导致测量过程容易受到需要检测的重要变化的影响。
- "制造商推荐运行长度(MRRL):制造商应推荐测量系统(包括仪器和试剂)的准确度和精密度预期是稳定的时间段或一系列测量。
- "用户定义运行长度(UDRL):用户应根据稳定性、患者结果报告间隔、再分析成本、工作流程模式、操作人员特征或类似的非分析性考虑,定义测量过程验证的重要时间周期或测量系列,这些考虑除了测量系统的准确度和精度的预期稳定性之外。”
这些陈述表明,运行应以时间单位或样本单位为基础,根据方法的预期稳定性、检测重要变化的大小以及使方法容易出现问题的条件的变化来定义。虽然最大运行周期由制造商定义,但用户有责任评估可能需要更短运行的实验室因素,因此运行定义是制造商和用户的共同责任。法规有时会设定另一个最大值,例如CLIA的最大运行长度为24小时。此外,应该认识到制造商很少处理需要检测的变化大小的问题,因此用户实际上有责任定义质量要求和运行长度。
在当今的高稳定性、高精度、随机访问分析仪中,以时间为单位定义运行长度通常是有意义的。在患者标本之前,首先分析对照也是可行的,以便在开始患者分析之前确保系统正常工作,然后定期监测以检查性能。这意味着多阶段QC设计,在启动期间具有高错误检测,在监控期间具有低错误拒绝。
对于某些电极类型的分析仪,暴露于样品可能以某种方式“积累”并导致问题,将运行长度定义为一定数量的样品可能是有意义的。
一对对照材料是立即分析,还是一个接一个地分析,还是随机顺序分析,按时间分开,比如早上一个,下午一个,这有什么区别吗?
在选择控制规则和控制测量的数量时,我们的QC规划方法是确定什么控制规则和多少控制测量是必要的,以确保在出现医学上重要的错误时获得失控信号。这意味着如果N=2,则需要这两个测量值来确定方法的控制状态。如果你等到下午才进行第二次测量,那么直到那时你才知道这个方法是否正常工作;同时,你可能已经报告了很多病人的结果。同样,对于现代仪器系统,我们主张采用多阶段QC程序,其启动设计将确保在分析任何患者样本之前达到必要的质量,然后随着时间的推移进行间隔控制,以寻找性能的变化。在运行过程中间隔控制是有道理的,这将为尽早发现问题提供最好的可能性。
包括患者平均水平以确保质量和检测分析前和分析因素是否重要,这些因素在对照样本中可能无法观察到?
对于可获得稳定对照材料的测试,患者数据质量控制程序,如平均值(AON),通常为监测方法性能提供次要和补充的方法。它们可能有助于发现反映标本处理和储存不当的分析前问题,以及在对照材料上不以相同方式出现的分析问题。一般来说,AON程序的设计更复杂,因为需要考虑其他因素,例如总体与分析SDs的比例以及所选择的截断限[参见Cembrowski GS, Chandler EP, Westgard JO]。评估“正常平均”质量控制程序和实施指南。中华病毒学杂志[J]; 2004; 31(2): 391 - 391。它们也往往更难实现,并且在许多实验室情况下不切实际,因为提供所需的错误检测所需的高N。
但是,可以确定功率曲线,然后我们可以使用OPSpecs图表和/或临界误差图应用相同的QC选择和设计方法。我们最近说明了如何做到这一点,并建议使用AON作为自动过程控制系统中测量运行长度的方法[参见Westgard JO, Smith FA, Mountain PJ, Boss S.设计和评估平均值(AON)患者数据算法以最大化自动过程控制的运行长度。中国生物医学工程学报(英文版);2006;16(2):391 - 391。
使用移动平均线的质量控制程序与多规则程序相比如何?
使用移动平均线的QC程序的表现与传统的平均规则相似,后者至少具有与多规则程序一样好的错误检测,甚至可能更好。我们在QC验证程序中提供了传统的平均/范围QC程序的功率曲线,以及各种多规则程序的功率曲线。Parvin推荐了一种多均值类型的QC程序,它应该比传统的多规则程序具有更好的错误检测[参见Parvin CA,比较质量控制规则检测持久性系统错误的能力,clinin Chem 1992;38:356-363]。