蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

具有已知结构的同二聚体的折叠机制的 CART 分配

Abishek Suresh、Pattabhiraman Lalitha 和 Pandjassarame Kangueane

蛋白质同型二聚体在催化和调节中发挥着关键作用,其折叠机制很有趣。已观察并记录了约 46 个同型二聚体(27 个 2S;12 个 3SMI;12 个 3SMI;12 个 3SMI)的同型二聚体折叠机制(无中间体的 2 态 [2S] 和具有单体 [3SMI] 或二聚体 [3SDI] 中间体的 3 态 [3S])。 7 3SDI)具有已知的 3D 结构。通过经典变性实验确定折叠机制既耗时、乏味又昂贵。因此,预测它们的折叠机制很有意义。此外,PDB 中还提供了大量折叠机制未知的同型二聚体结构。因此,利用每个复杂结构固有的结构特征来预测它们的折叠机制是引人注目的。因此,我们使用预测参数((a) 单体蛋白大小 (ML);(b) 界面面积 (B/2);(c) 与总残基的界面 (I/T))开发了分类和回归树 (CART) 模型比)源自数据集(46 个具有已知结构和折叠机制的同二聚体),用于折叠机制预测。数据集主观分为训练集(13 2S;6 3SMI;3 3SDI)和测试集(14 2S;6 3SMI;4 3SDI)进行验证。该模型在使用 ML 和 I/T 作为预测变量的训练和测试过程中预测 2S 和 3SMI 的效果相当好。但值得注意的是,该模型对 3SDI 的分类性能较差。尽管如此,由于包含预测变量 B/2,该模型并不稳定,因此在训练和测试期间未考虑该模型。CART 模型在训练期间产生的准确度为 85% (2S)、83% (3SMI) 和 100% (3SDI),阳性预测值 (PPV) 为 100% (2S)、83% (3SMI) 和 75% (3SDI) 。然后,在测试过程中,其准确度为 100% (2S) 和 50% (3SMI),阳性预测值 (PPV) 为 74% (2S)、60% (3SMI)。因此,我们然后使用该模型将折叠机制分配给具有已知结构和未知折叠机制的蛋白质同二聚体。本练习为预测具有未知折叠机制的同二聚体结构提供了一个框架,以便通过折叠实验进一步验证。CART 模型能够将折叠机制分配给所有 (169) 个同二聚体结构(具有未知的折叠数据),因为它具有自动鲁棒的学习能力,这与手动开发的决策模型不同,手动开发的决策模型留下了一些未分配的结构。训练期间,阳性预测值 (PPV) 为 100% (2S)、83% (3SMI) 和 75% (3SDI),分别为 83% (3SMI) 和 100% (3SDI)。然后,在测试过程中,其准确度为 100% (2S) 和 50% (3SMI),阳性预测值 (PPV) 为 74% (2S)、60% (3SMI)。因此,我们然后使用该模型将折叠机制分配给具有已知结构和未知折叠机制的蛋白质同二聚体。本练习为预测具有未知折叠机制的同二聚体结构提供了一个框架,以便通过折叠实验进一步验证。CART 模型能够将折叠机制分配给所有 (169) 个同二聚体结构(具有未知的折叠数据),因为它具有自动鲁棒的学习能力,这与手动开发的决策模型不同,手动开发的决策模型留下了一些未分配的结构。训练期间,阳性预测值 (PPV) 为 100% (2S)、83% (3SMI) 和 75% (3SDI),分别为 83% (3SMI) 和 100% (3SDI)。然后,在测试过程中,其准确度为 100% (2S) 和 50% (3SMI),阳性预测值 (PPV) 为 74% (2S)、60% (3SMI)。因此,我们然后使用该模型将折叠机制分配给具有已知结构和未知折叠机制的蛋白质同二聚体。本练习为预测具有未知折叠机制的同二聚体结构提供了一个框架,以便通过折叠实验进一步验证。CART 模型能够将折叠机制分配给所有 (169) 个同二聚体结构(具有未知的折叠数据),因为它具有自动鲁棒的学习能力,这与手动开发的决策模型不同,手动开发的决策模型留下了一些未分配的结构。

Top