国际标准期刊号: 2169-0111
宋念峰、王坤、徐梦露、谢晓露、陈甘、王颖
基因表达水平对于癌症等疾病的诊断很重要。本文提出了一种基于支持向量机的集成分类器,根据微阵列数据的基因表达水平对对照组和癌症组进行分类。开发了与 Adaboost 算法相结合的组合递归特征消除,以选择重要特征并设计适当的分类器。该方法应用于癌症患者的微阵列数据,结果显示成功率有所提高。通过 AUC 计算,基于 SVM 的集成分类器显示出优越的性能。此外,还讨论了其特征以及对分类性能的不同影响问题。如果单个 SVM 可以获得令人满意的分类性能,那么集成 SVM 就很难改善它。否则,SVM 的集合优于最好的单个 SVM。我们还研究了核函数、特征选择和分类器类型对分类的影响。