蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

DecoyPyrat:用于大规模蛋白质组学的快速非冗余混合诱饵序列生成

詹姆斯·C·赖特 (James C Wright) 和乔蒂·S·乔杜里 (Jyoti S Choudhary)

在基于质谱的蛋白质组学实验中,对串联质谱的序列数据库肽鉴定进行准确的统计评估至关重要。这些统计数据依赖于精确建模的随机识别。目标诱饵方法已成为计算蛋白质组数据集中 FDR 的事实上的方法。这种方法的主要原理是搜索一组诱饵蛋白序列,这些序列模拟所搜索的目标蛋白序列的大小和组成,但与样本中的真实蛋白不匹配。为此,通常会对目标数据库中的蛋白质和肽进行反转或改组。然而,这些方法有其缺点和局限性。一个关键的混淆问题是目标数据库和诱饵数据库之间的肽冗余导致 FDR 估计不准确。在蛋白质水平以及搜索大型序列数据库(例如用于蛋白质基因组学的数据库)时,这种不准确性会进一步放大。在这里,我们提出了一种统一的混合方法,可以快速有效地生成诱饵序列,并且目标肽和诱饵肽之间的重叠最小。我们证明,应用反向诱饵方法可以产生高达 5% 的肽冗余,并且更多其他肽将具有与目标肽完全相同的前体质量。我们的混合方法通过首先用前面的氨基酸交换蛋白水解切割位点,反转数据库,然后改组任何冗余序列来解决这两个问题。这种灵活的混合方法将目标肽和诱饵肽之间的肽重叠减少到肽的 1% 左右,从而形成适合大型搜索空间的更稳健的诱饵模型。

Top