遗传工程的进展

遗传工程的进展
开放获取

国际标准期刊号: 2169-0111

抽象的

癌症基因表达数据集成分类器的设计与分析

宋念峰、王坤、徐梦露、谢晓露、陈甘、王颖

基因表达水平对于癌症等疾病的诊断很重要。本文提出了一种基于支持向量机的集成分类器,根据微阵列数据的基因表达水平对对照组和癌症组进行分类。开发了与 Adaboost 算法相结合的组合递归特征消除,以选择重要特征并设计适当的分类器。该方法应用于癌症患者的微阵列数据,结果显示成功率有所提高。通过 AUC 计算,基于 SVM 的集成分类器显示出优越的性能。此外,还讨论了其特征以及对分类性能的不同影响问题。如果单个 SVM 可以获得令人满意的分类性能,那么集成 SVM 就很难改善它。否则,SVM 的集合优于最好的单个 SVM。我们还研究了核函数、特征选择和分类器类型对分类的影响。

Top