国际标准期刊号: 0974-276X
阿利斯泰尔·VG·爱德华兹、格雷戈里·J·爱德华兹、马丁·R·拉森和斯图尔特·J·科德威尔
背景:从包含翻译后修饰的蛋白质组数据集中提取生物学意义是大规模蛋白质组学和系统生物学的核心挑战。我们报告了新程序(ReportSites)的生成,该程序使用质谱结合蛋白质表征的肽序列,在大规模蛋白质组数据集中精确识别特定氨基酸残基或残基组的位置和局部化学环境序列数据库。该程序非常适合从翻译后修饰数据集中提取区域和空间信息,其中处理位点周围的序列模式可能更多地揭示修饰的功能和结构要求以及调节它们的生化过程。
结果:我们使用来自大鼠心肌的磷酸蛋白质组数据测试集开发了 ReportSites,其中包含大约 11000 个独特的磷酸化位点。这些位点用于识别与完整蛋白质序列背景下的位点位置(空间序列信息)相关的模式,以及直接物理化学环境的两个选定方面(局部 pI 和疏水性)。然后还将这些值与从完整数据库中提取的相应值进行比较,以比较磷酸化趋势。
结论: ReportSites 能够在包含 11000 个磷酸位点的测试集中破译蛋白质磷酸化的物理化学方面。还记录了修饰蛋白质的基本特性,例如完整蛋白质中的位点位置。该程序可以轻松适应任何翻译后修饰(或者实际上任何定义的氨基酸序列),或扩展到包括更多描述性因素(例如结合域或蛋白质结构的修饰)。这使其成为一种多功能工具有可能有助于揭示翻译后修饰分布的新方面。作者可根据要求免费提供该代码,并且可以在线访问。