国际标准期刊号: 0974-276X
米哈伊尔·皮亚特尼茨基、玛丽亚·卡尔波娃、谢尔盖·莫什科夫斯基、安德烈·利西察和亚历山大·阿尔查科夫
血清或血浆的质谱分析是广泛用于制作不同癌症类型的实验诊断系统的工具之一。在这种方法中,一组辨别峰充当多重癌症生物标志物。因此,峰的充分选择是诊断规则制定的关键阶段。在本文中,我们建议在完整的交叉验证方案中使用顺序过滤器和包装器特征选择,并在每次交叉验证运行时分别执行特征选择。过滤器特征选择通过层次聚类分析来表示;递归特征消除与支持向量机相结合被用作包装器特征选择方法。该方法的性能在之前获得的卵巢癌和非癌症血清数据集上得到了证明。我们的方法的应用导致准确性略有提高,但具有统计学意义。峰聚类有利于特征选择的更稳定结果,并为选定的 m/z 值提供生物学意义。