背景
传统质控临床应用中的技术问题包括:质控品互换性差,导致假性预警;质控品的浓度水平不足,监测范围受限;质控品的检测频次过低;使用成本过高等。为解决这些问题,有学者提出仅利用患者数据,建立基于患者样本的实时质量控制方法(Real-time quality control based on patient samples,PBRTQC),但是仍然存在对个别项目精准度不足临床需求,对信息化要求较高等缺点。
近年来在互联网大数据这一环境下,机器学习(Machine Learning,ML)的发展为医疗与健康服务带来了变革与创新。我们建立基于机器学习技术的分类算法建立一套全新的实时质量控制方法,以弥补传统统计学方法的不足。
【分析中的误差特点】
方法
根据临床应用场景,分不同的研究阶段:首先建立质控体系,将机器学习算法与IFCC首推的统计学算法(EWMA、MA、MM、HD50)比较;之后针对超敏项目的小误差识别单独开展实验,将机器学习算法与统计学算法(MovSD、MovSO)比较。
在机器学习层面,针对不同误差进行分段学习。前期通过规则清洗、去噪、数据标准化等预处理操作,对不同分布形态的数据采取不同的特征提取,以提高模型对当前数据集预测能力。模拟不同类型和大小的误差作为实验场景,调节算法参数,以达到更强的拟合能力。
此外,在混淆样本识别方向基于深度学习建立混淆样本的高精度识别模型并与传统的delta check(DC)做比较。
【研究历程】
统计学方法包括:EWMA(移动加权平均)、MA(移动平均数)、MM(移动中位数)、HD50(移动统计中值)、MovSD(移动标准差)、MovSO(移动异常量),建立质控控制限的方法如图所示。
【统计学方法实验流程】
机器学习方法:分为连续异常监控模块与随机异常监控模块,经过独特的队列转化,建立质控模型的方法如图所示。
【基于机器学习的质控建模流程】
结果
实验证明,在相同假阳性率的情况下,ML算法对质控失控识别准确度和识别效率显著优于传统PBRTQC算法。例如,来自西门子advia2400检测的5种化学分析物:谷丙转氨酶(ALT)、谷草转氨酶(AST)、葡萄糖(GLU)、总蛋白(TP)和白蛋白(ALB)患者结果在不同算法下的报警延迟数(MNPed)如图所示:
【比例误差场景下的MNPed】
【恒定误差场景下的MNPed】
【随机误差场景下的MNPed】
此外,针对样本混淆,delta check(DC)是传统的检测方式,但是由于错误检测不足和假阳性率高,在真实环境中实施DC的效果精度不高。我们采用了2家医院实验室采集的22个血液常规检测项目建立了基于深度学习DBN的高精度的方法来检测样本混淆,与三种公认的统计学方法进行比较,评价了该模型的临床有效性。
【检测样本混淆实验流程】
【深度学习算法与传统DC实验对比结果】
实验证明,采用大数据人工智能技术建立的新型质控体系,仅利用患者样本时实监控医学实验室检测结果质量,可以弥补传统统计学算法的缺陷。可作为系统软件部署于医院检验系统、检验仪器系统,作为服务端部署于可执行计算机程序的计算器中,供远程客户端访问。项目研究成果通过软件开发,进行临床推广应用,保障患者安全,惠及临床医护及病患。