蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

通过支持向量机根据序列比对预测蛋白质模型质量

邓鑫、李继龙、程建林

评估蛋白质结构模型的质量对于蛋白质结构预测至关重要。在这里,我们开发了一种支持向量机(SVM)方法,根据从用于生成模型的序列比对中提取的特征来预测蛋白质结构模型的质量得分(GDT-TS 得分)。我们开发了一种支持向量机(SVM)模型质量评估方法,以查询单模板成对对齐或查询多模板对齐作为输入。对于成对比对方案,输入 SVM 预测器的输入特征包括给定比对的归一化 e 值、比对中相同残基对的百分比、查询的残基与模板的残基比对的百分比,以及所有比对残基的 BLOSUM 分数之和除以比对位置的长度。类似地,对于多重比对方案,输入特征包括目标序列的残基与一个或多个模板中的残基比对的百分比、目标序列的比对残基与任一模板中的残基相同的百分比,比对残基的平均 BLOSUM 分数和比对残基的平均 Gonnet160 分数。SVM 回归预测器在训练数据上进行训练,以根据输入特征预测模型的 GDT-TS 分数。计算预测和实际 GDT-TS 分数之间的均方根误差 (RMSE) 和绝对平均误差 (ABS) 以评估性能。应用五倍交叉验证,根据五倍的平均 RMSE 和 ABS 选择最佳参数值。优化后的SVM预测器在测试数据上的RMSE和ABS接近0.1。SVM 和基于序列比对的预测器的良好性能表明,将序列比对特征与 SVM 集成对于蛋白质模型质量评估是有效的。

Top