国际标准期刊号: 2090-4924
Geetha Govindan 和 Achuthsankar S Nair
蛋白质运输或蛋白质分选是细胞将蛋白质运输到细胞内或细胞外适当位置的机制。这种靶向是基于蛋白质中包含的信息。许多方法根据序列信息预测真核生物中蛋白质的亚细胞位置。然而,这些方法大多数使用平面结构来执行预测。在这项工作中,我们引入了集成方法来分层预测真核蛋白质分选非膜途径中的位置。我们使用专门从全长蛋白质序列中提取的特征以及特征子集选择来进行分类。序列驱动功能,使用集成学习器测试序列映射特征和序列自相关特征,并比较使用和不使用特征子集选择技术的分类器性能。这项研究表明,从全长真核蛋白质序列中提取的新特征可有效捕获两个水平的真核非膜途径区室之间的生物学特征。特征子集选择技术有助于减少构建分类模型所需的时间。