蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

对 Y 短串联重复数据进行分类:决策树方法

Ali Seman、Ida Rosmini Othman2、Azizian Mohd Sapawi 和 Zainab Abu Bakar

最近在监督和非监督分类中引入了对 Y 短串联重复数据进行分类。本研究继续基于四种决策树模型对 YSTR 数据进行分类:CHisquared 自动交互检测 (CHAID)、分类和回归树 (CART)、快速、无偏、高效统计树 (QUEST) 和 C5。使用名为 IBM Statistical Package for the Science Social Modeler 15.0 (IBM® SPSS® Modeler 15) 的数据挖掘工具来评估模型在六个 Y-STR 数据上的性能。总体结果表明,决策树模型能够对所有六个 Y-STR 数据进行显着分类。在这四个模型中,C5 是最一致的模型,其准确率最高,为 91.85%,敏感性得分为 93.69%,特异性得分为 96.32%。

Top