医疗保健实验室的工具、技术和培训

“Westgard规则”

《Westgard Rules》和《Multirules》

什么是“韦斯特加德规则”?你如何使用它们?
你曾经想知道(或可能不知道)关于多规则QC的一切。
多规则在实验室中通常被称为“韦斯特加德规则”。
这里是找到更多关于他们的最好地方。

本文由LGC Technopath临床诊断公司独家赞助
Westgard EML广告600 150像素

“韦斯特加德规则”与多规则质量控制

寻找“韦斯特加德规则”工作表?点击这里

什么是多规则QC程序?

首先,是非技术性的描述。我女儿克里斯汀小时候住在家里,她喜欢聚会。有一天,当她告诉我她又打算在外面待到很晚的时候,我觉得有必要对她的时间进行一些家长式的控制。所以我告诉她,如果她出去了三下一次,两下两次,一下四次她遇到了大麻烦。这就是多规则控制。

Kristin讨厌我讲这个故事,虽然它不完全是真的,但它仍然是一个很好的故事,让每个人都能理解多规则QC。(顺便说一下,她后来还不错;她以全班第一名的成绩从法学院毕业,我为她感到骄傲。的确,她有她母亲的头脑,再加上我的坚持不懈——或者说是固执,这在家里是众所周知的——构成了一个很好的组合。)我也不得不承认,在我们家,威斯特加德太太的规矩才是真正重要的。我的妻子琼不喜欢我讲这个故事的这一部分,但她已经容忍我35年多了,我现在已经处于相当稳定的控制状态,所以在我陷入大麻烦之前,我不会有更大的偏差。

原始的“韦斯特加德规则”

现在是更专业的描述。多规则QC使用决策标准或控制规则的组合来确定分析运行是在控制中还是失控。著名的Westgard多规则QC程序使用5种不同的控制规则来判断分析运行的可接受性。相比之下,单一规则QC程序使用单一标准或单一控制限制,例如Levey-Jennings图表,其控制限制设置为平均值正负2个标准差(2s)或平均值正负3s。“Westgard规则”通常用于每次运行2或4次控制测量,这意味着当两种不同的控制材料每种材料测量1或2次时,它们是合适的,这在许多化学应用中都是如此。当分析三种对照材料时,一些替代对照规则更适合,这在血液学,凝血和免疫测定中应用很常见。

什么是“韦斯特加德规则”?

为方便起见,我们采用速记符号来缩写不同的决策标准或控制规则,例如,12 s表示1项控制测量超过2项控制限值。我们更喜欢用下标来表示控制范围,但其他文本和论文可能会使用一些不同的符号(例如1:25而不是1)2 s规则的组合通常通过在控制规则之间使用“斜杠”标记(/)来表示,例如13 s/ 22 s

单独的规则定义如下。规则旁边的“缩略图”图形显示了违反该规则的控件结果示例。您可以单击图形以获得更清楚地说明每个控制规则的应用程序的大图。

13 s指的是通常用于列维-詹宁斯图的控制规则,当控制限制被设置为平均值加3秒和平均值减3秒时。当单个控制测量值超过平均值加3秒或平均值减3秒的控制极限时,一次运行被拒绝。

mrf2

12 s指的是当控制限制被设置为平均值±2s时,通常与列维-詹宁斯图一起使用的控制规则。在最初的Westgard多规则QC程序中,此规则用作警告规则,以触发以下拒绝规则对控制数据的仔细检查。

mrf3

22 s-当两个连续的控制测量值超过相同的平均值加2s或相同的平均值减2s控制极限时,拒绝。

mrf4

R4 s-当一组中的一个控制测量值超过平均值+ 2s,另一个超过平均值- 2s时,拒绝。这条规则应该只在跑中解释,而不是在跑中解释。下面的图表实际上应该暗示点5和点6是在同一运行。

mrf5

41-当连续4个控制测量值超过同一平均值加1s或同一平均值减1s控制极限时,拒绝。

mrf6

10x-当连续10个对照测量值落在平均值的一侧时,拒绝。

mrf7

此外,你有时会看到最后一条规则的一些修改,使它更容易适应n (4):

8x-当连续8个对照测量值落在平均值的一侧时,拒绝。

mrf12

12x-当连续12个对照测量值落在平均值的一侧时拒绝。

mrf15

上述控制规则通常用于N为2或4的情况,这意味着当两种不同的控制材料每种材料测量1或2次时,它们是合适的。

还有哪些常见的多规则?

在分析3种不同控制材料的情况下,一些其他控制规则更适合,更容易应用,例如:

2 of32 s-当3个控制测量值中有2个超过相同的平均±2s或平均- 2s控制极限时拒绝;

mrf8

3.1-当连续3个控制测量值超过相同的平均值+ 1s或平均值- 1s控制极限时,拒绝。

mrf9

6x-当连续6个对照测量值落在平均值的一侧时,拒绝。

mrf10

此外,你有时会看到最后一条规则的一些修改,以包含更大数量的控制测量,但仍然适合N为3:

9x-当连续9个对照测量值落在平均值的一侧时,拒绝。

mrf13

有时使用的一个相关控制规则,特别是在欧洲,寻找连续几个控制测量增加或减少的“趋势”[注意:越来越少看到这个规则在使用中]:

7T-当7个控制测量值趋向于同一方向,即逐渐升高或逐渐降低时,拒绝。

例7:T控制规则违反

如何执行多规则质量控制?

收集控制测量值的方法与常规的levy - jennings控制图相同。用同样的方法建立对照材料的均值和标准偏差。所有改变的是控制限制和数据解释,所以多规则QC真的不是那么难做!对于手动应用,在列维-詹宁斯图上画线,在正/负3s,正/负2s和正/负1s的平均值处。看到QC - Levey Jennings图表有关准备控制图的更多信息。

在手动应用程序中,12 s规则应该用作触发其他规则的应用程序的警告,因此,每当单个测量超过2s控制限制时,您就可以通过使用其他规则检查控制数据来响应。这就像两条路交叉路口的退让或警告标志。这并不意味着停止,而是在继续之前仔细观察。

你怎么“仔细看”?使用其他控制规则检查控制点。如果单点超过3秒限制就停止。如果连续两个点超过相同的2s限制,则停止。如果组中的一个点超过+ 2s极限,另一个点超过- 2s极限,则停止。因为N必须至少为2才能满足美国CLIA QC要求,所以所有这些规则都可以在一次运行中应用。通常是41和10x必须跨运行使用,以便获得应用规则所需的控制度量的数量。一个41当连续4分超过相同的15分限制时,即为违规。这4点可能来自一个控制材料,也可能是高级控制材料的最后2点和普通控制材料的最后2点,因此该规则也可以适用于所有材料。10x规则通常必须跨运行和跨材料应用。

计算机应用程序不需要使用12 s预警规则。你们应该能够在每次测试的基础上选择单独的拒收规则,以在每种分析方法观察到的精密度和准确度以及测试要求的质量的基础上优化QC程序的性能。

N是多少?

当N = 2时,这可能意味着在一种对照材料上进行两次测量,或者在两种不同的对照材料上各进行一次测量。当N = 3时,应用程序通常涉及对三种不同对照材料中的每种材料进行一次测量。当N = 4时,这可能意味着在两种不同的对照材料上分别进行2次测量,或者在一种材料上进行4次测量,或者在四种材料上各进行1次测量。

一般来说,N表示在决定控制状态时可用的控制度量的总数。

为什么使用多规则QC程序?

多规则的QC程序显然比单一规则的程序更复杂,所以这是一个缺点。但是,它们通常比常用的12 s和13 s单一规则的QC程序。1有误报问题2 s规则,如具有2s控制限的利维-詹宁斯图;当N=2时,预期有9%以上的良好运行被误拒;当N=3时,比例更高,约为14%;N=4时,接近18%这意味着近10-20%的良好运行将被丢弃,这在实验室浪费了大量的时间和精力。虽然具有3s控制限的levy - jennings图表具有非常低的误拒率,当Ns为2-4时只有1%左右,但错误检测(真警报)也会更低,因此出现了1的问题3 s控制规则是医学上重要的错误不能被发现。(见QC -拒绝特性有关错误检测和错误拒绝概率的更多信息。)

多规则质量控制程序的优点是可以在保持高错误检测的同时保持低误拒率。这是通过选择具有非常低的错误拒绝水平的单个规则来实现的,然后通过将这些规则一起使用来构建错误检测。这就像做两次肝功能检查,如果其中一个结果是阳性,就诊断出问题。多规则QC程序使用两个或多个统计测试(控制规则)来评估QC数据,如果其中任何一个统计测试为正,则拒绝运行。

质量控制测试和诊断测试是否有类似的策略?

是的,质量控制测试就像诊断测试一样!QC测试试图识别分析测试过程正常操作中的问题,而诊断测试试图识别人的正常操作中的问题。适当的行动或治疗取决于正确地识别问题。

质量控制测试和诊断测试都受到正常变化的影响,这是在没有问题的情况下预期的。, QC测试试图识别由于方法不精确而超出正常预期的变化,而诊断测试试图识别由于群体变化(测试的参考范围或参考区间)或个体变化(个体内生物变异)而超出正常预期的变化。这种背景变化或“噪声”的存在限制了QC测试和诊断测试的性能。

质量控制和诊断测试是否有相似的性能特征?

这种背景变化会导致错误警报,浪费时间和精力。这些假警报更恰当地称为诊断测试的假阳性和QC测试的假拒绝,但两者都与称为“测试特异性”的一般特征有关。真警报在诊断测试中被称为真阳性,在QC测试中被称为错误检测,两者都与称为“测试灵敏度”的一般特性有关。因此,敏感性和特异性是一般的性能特征,可应用于将结果分类为阳性或阴性(如诊断测试)或接受或拒绝(如QC测试)的测试。

诊断测试很少是完全敏感和完全特异的!因此,医生已经开发出方法和策略来提高诊断测试的性能。一种方法是调整将测试结果分类为阳性或阴性的截止限制或决策水平。灵敏度和特异性都随着这个极限的变化而变化,灵敏度的提高通常伴随着特异性的丧失,反之亦然。

同样,质量控制程序也很少有完美的错误检测和错误拒绝。实验室可以采用类似的方法来优化QC性能。改变控制极限就像改变截止极限一样,灵敏度的提高通常是以牺牲特异性为代价的(12 s规则是一个例子)。更宽的控制范围,如2.5s、3s和3.5s,可以降低错误检测和误拒率。

如何使用多个测试来优化性能?

优化诊断性能的另一种方法是使用多个测试。为了提高灵敏度,两个或更多的测试一起使用,如果其中任何一个测试是阳性的,就会发现问题——这是并行测试。为了提高特异性,在敏感筛查试验中发现阳性结果后,可以进行第二次更具体的测试来确认问题——这是连续测试。敏感性和特异性都可以通过多种测试方法来优化,但这些变化通常会影响这两种特征。

具有多个测试的策略也可用于优化QC过程的性能。多规则QC是实现此目的的一般方法。目标是减少由于使用2s控制限制而引起的误报警或误拒绝问题,同时在使用3s控制限制时改进错误检测。多个测试是不同的统计测试或不同的统计控制规则,策略基于串行和并行测试。

  • 通过使用1来最小化假警报2 s规则作为警告规则,然后通过应用错误拒绝概率较低的更具体规则(串行测试)来确认任何问题。
  • 通过选择对随机和系统错误检测最敏感的规则组合,然后在违反这些规则中的任何一条时拒绝运行(并行测试),可以最大化地实现真实警报或错误检测。

什么时候应该使用多规则QC程序?

不总是!有时,单一规则QC程序可以提供所需的所有错误检测,同时保持低误拒率。这通常意味着消去12 s规则,因为它的高错误拒绝和考虑其他如12.5秒, 13 s,和13.5秒有可接受的低错误拒绝率。剩下的问题是这些其他单规则QC程序是否可以提供足够的错误检测。如果能在90%的时间内检测到医学上重要的错误(即,错误检测概率为0.90或更高),那么单一规则QC程序就足够了。如果单规则QC程序不能提供90%的错误检测,则应考虑采用多规则QC程序。一般来说,你会发现单规则QC程序对于你的高度自动化和非常精确的化学和血液分析仪是足够的,但你应该避免使用2s控制限或12 s控制规则,减少浪费,降低成本。早期的自动化系统和手动方法通常会受益于改进的多规则QC程序的错误检测。

为了准确地确定何时使用单规则或多规则QC程序,您将需要定义每个测试所需的质量,查看您的方法所达到的精度和准确性,然后评估误拒的概率(Pfr)和错误检测(P艾德),以了解不同的候选QC程序。目标是90%的错误检测(P艾德0.90或更高)和5%或更低的误拒(Pfr0.05或更小)。对于很少出现问题的非常稳定的分析系统,您可以满足于较低的错误检测,例如50%。(见QC -规划过程以了解选择合适的单规则和多规则QC程序的实用方法。)

有关更多信息,请参阅以下参考:

  • Westgard JO, Barry PL, Hunt MR, growth T.临床化学质量控制的多规则Shewhart图。临床化学1981;27:493-501。
  • 杨建军,李建军。基于多规则控制程序的质量控制改进。第4章成本效益质量控制:管理分析过程的质量和生产力。AACC出版社,华盛顿特区,1986,第92-117页。
  • 魏嘉德。质量管理。第16章临床化学基础,第4版。陈志强主编,美国华信出版社,1996,页211-223。
  • 魏嘉德。质量管理。《临床化学教材》第二版第十七章。陈志强主编,美国华信出版社,1994,页548-592。
  • 森布罗斯基GS,沙利文AM。质量控制和统计,临床化学第4章:原则,程序,相关性,第3版。毕晓普编,利平科特,费城,1996年,第61-96页。
  • Cembrowski GS, Carey RN。质量控制程序。第四章实验室质量管理。ASCP出版社,芝加哥,1989,第59-79页。

Joomla SEF url由Artio提供