DecoyPyrat：用于大规模蛋白质组学的快速非冗余混合诱饵序列生成

詹姆斯·C·赖特 (James C Wright) 和乔蒂·S·乔杜里 (Jyoti S Choudhary)

抽象的

DecoyPyrat：用于大规模蛋白质组学的快速非冗余混合诱饵序列生成

詹姆斯·C·赖特 (James C Wright) 和乔蒂·S·乔杜里 (Jyoti S Choudhary)

在基于质谱的蛋白质组学实验中，对串联质谱的序列数据库肽鉴定进行准确的统计评估至关重要。这些统计数据依赖于精确建模的随机识别。目标诱饵方法已成为计算蛋白质组数据集中 FDR 的事实上的方法。这种方法的主要原理是搜索一组诱饵蛋白序列，这些序列模拟所搜索的目标蛋白序列的大小和组成，但与样本中的真实蛋白不匹配。为此，通常会对目标数据库中的蛋白质和肽进行反转或改组。然而，这些方法有其缺点和局限性。一个关键的混淆问题是目标数据库和诱饵数据库之间的肽冗余导致 FDR 估计不准确。在蛋白质水平以及搜索大型序列数据库（例如用于蛋白质基因组学的数据库）时，这种不准确性会进一步放大。在这里，我们提出了一种统一的混合方法，可以快速有效地生成诱饵序列，并且目标肽和诱饵肽之间的重叠最小。我们证明，应用反向诱饵方法可以产生高达 5% 的肽冗余，并且更多其他肽将具有与目标肽完全相同的前体质量。我们的混合方法通过首先用前面的氨基酸交换蛋白水解切割位点，反转数据库，然后改组任何冗余序列来解决这两个问题。这种灵活的混合方法将目标肽和诱饵肽之间的肽重叠减少到肽的 1% 左右，从而形成适合大型搜索空间的更稳健的诱饵模型。

免责声明: 此摘要通过人工智能工具翻译，尚未经过审核或验证.

蛋白质组学与生物信息学杂志开放获取

抽象的

DecoyPyrat：用于大规模蛋白质组学的快速非冗余混合诱饵序列生成

蛋白质组学与生物信息学杂志
开放获取