Jen-Ping Lee, Yu-Lin Chao, Ping-Hsun Wu, Yun-Shiuan Chuang, Chan Hsu, Pei-Yu Wu, Szu-Chia Chen, Wei-Chung Tsai, Yi-Wen Chiu, Shang-Jyh Hwang, Yi-林婷、郭美全
目的:心脏功能是接受血液透析 (HD) 的患者的全因死亡率和心血管死亡率的可靠且看似独立的预测指标。对高效心脏功能评估的迫切需求促使我们探索使用可获得的血液样本进行评估的潜力。在本研究中,我们谨慎地利用心血管蛋白质组学与机器学习 (ML) 技术相结合,探索预测 HD 患者心脏功能的可行性。
方法:从台湾南部的两个单位收集了 328 名 HD 患者。利用邻近扩展分析,对 184 种心血管蛋白进行了全面测量。利用机器学习,我们优化了基于射血分数预测心脏功能障碍的模型。使用曲线下面积 (AUC) 评估模型性能,同时使用 Shapley 值分层平均显著性 (SHAP) 方法来识别预测的关键变量。
结果:在我们的分析框架内,使用包含 184 个蛋白质组生物标志物和 34 个标准临床变量的数据集,发现使用各种机器学习算法,包括分类和回归树 (CART)、最小绝对收缩和选择算子 (LASSO)、随机森林、Ranger 和极端梯度提升 (XgBoost) 模型,可以发现“蛋白质组生物标志物”的预测效果超过了“常规临床和实验室变量”。通过应用 XgBoost 进行特征选择,N 端前 B 型利钠肽 (NT-proBNP) 的重要性成为最重要的贡献者,血管紧张素转换酶 2 (ACE-2) 和壳三糖苷酶-1 (CHIT- 1) 在确定心脏功能障碍方面的预测作用也起到了补充作用。基于 SHAP 的 XgBoost 模型的阐明再次证实了这种一致性。
结论:使用机器学习预测心脏功能障碍时,蛋白质组学特征优于临床变量。使用 XgBoost 和 SHAP 进行进一步分析,发现 NT-proBNP 和 CHIT-1 是关键的生物标志物,这为通过血液生物标志物评估 HD 患者的心脏功能障碍提供了启示。