国际标准期刊号: 2161-0932
莱因哈特·约翰
背景:临床决策困境在 IVF 实践中尤其值得注意,因为通常会生成大量数据集,使临床医生能够做出预测,为治疗选择提供信息。这项研究通过使用 IVF 数据应用机器学习来确定两个或更多胚胎可用于移植时双胞胎的风险。虽然大多数分类器能够提供准确度估计,但本研究进一步通过准确度和曲线下面积 (AUC) 比较分类器。
方法:研究数据来自一个大型电子病历系统,该系统被 140 多家 IVF 诊所使用,包含 135,000 个 IVF 周期。数据集从 88 个变量减少到 40 个,并且仅包括产生两个或更多囊胚胚胎的 IVF 周期。比较了以下分类器的准确性和 AUC:广义线性模型、线性判别分析、二次判别分析、K 最近邻、支持向量机、随机森林和 boosting。还应用了堆叠集成学习算法,以便使用分类器的预测来创建新模型。
结果:虽然集成分类器是最准确的,但没有一个分类器明显优于其他分类器。研究结果表明,分类器的增强方法表现不佳;逻辑和线性判别分析分类器的性能优于二次判别分析分类器,支持向量机的性能几乎与树分类器一样好。AUC 结果与准确性比较一致。还使用包含 588 个观察值的不同数据集进行了外部验证。所有模型在使用外部验证数据集时都表现更好,其中随机森林分类器的表现明显优于任何其他分类器。
结论:这些结果支持了大数据在临床决策过程中具有价值的印象;但没有任何一种统计算法可以为所有数据库提供最大的准确性。因此,需要对不同的数据集进行调查,以确定哪些算法对于特定数据集最准确。这些发现强调了这样一个前提:能够访问大量数据的临床医生可以使用先进的预测分析模型来创建对患者护理至关重要的可靠临床信息。