国际标准期刊号: 0974-276X
哈桑·莫哈巴特卡、科梅尔·阿米尼、帕里莎·拉比埃、卡姆兰·曼苏里
目的:如今,人乳头瘤病毒 (HPV) 被认为是第二常见的致癌物。人们已经认识到,HPV 的结构蛋白与其致癌性有关。这项工作的目的是分析 HPV 蛋白,并根据其理化特性和 Chou 的伪氨基酸概念将其分为低风险和高风险两类。
材料和方法:首先,从NCBI数据库和Uniprot收集了属于高风险病毒的69个蛋白质和属于低风险病毒的107个蛋白质的序列。然后使用 PseAAC 服务器来分析这些序列。下一步,软件将从该服务器获取的信息进行分析。KNN算法用于对数据集进行分类。此外,对分类器应用了 10 倍和 6 倍交叉验证测试来评估我们的预测方法。
结果:我们提出的方法的特异性、敏感性和准确性在处理数据集中分别达到 87.64%、87.22% 和 87.39%,在测试数据集中分别达到 91.11%、82.60% 和 86.66%。
结论:在本研究中,我们开发了一种基于序列的方法来预测 HPV 蛋白的致癌性,并将其分为高风险和低风险类别。