国际标准期刊号: 0974-276X
Sima Naghizadeh、Vahid Rezaeitabar、Hamid Pezeshk 和 David Matthews
分析和建模生物数据的重要工具之一是隐马尔可夫模型(HMM),它用于基因预测、蛋白质二级结构和其他基本任务。HMM 是一个随机过程,其中隐马尔可夫链称为:状态链,发出一系列观察结果。使用这个序列,可以解决有关基础排放生成方案的各种问题。将 HMM 应用于任何特定情况都是试图推断链中的哪个状态发出观察结果。这通常称为后验解码。一般来说,假设排放有条件地相互独立。在这项工作中,我们考虑了国家和排放之间的一些依赖性。我们研究的目的是研究排放之间的某种关系,重点是马尔可夫特性。我们假设观察到发射的概率不仅取决于当前状态,还取决于先前的状态和先前的发射之一。我们还使用其他环境信息,并使用相对溶剂可及性 (RSA) 将氨基酸分为三组。我们还研究了这种修改如何改变普通 HMM 的当前算法,并为新模型引入修改后的维特比和前向-后向算法。我们将我们提出的模型应用于有关蛋白质二级结构预测的实际数据集,并证明与普通 HMM 相比准确性有所提高。特别是,我们使用 RSA 信息的修改后的 HMM 的总体准确率为 63.95%。这比在相同数据集上使用普通 HMM 实现的预测精度高 5.9%,