免疫组学研究

免疫组学研究
开放获取

国际标准期刊号: 1745-7580

抽象的

表位分析的综合方法 I:使用氨基酸主成分和回归方法对 MHC 结合进行降维、可视化和预测

简·霍曼

背景:免疫系统的运作是多变量的。降维对于促进理解这个复杂的生物系统至关重要。免疫系统的一个多维方面是不同个体群体的表位与 MHC-I 和 MHC-II 分子的结合。此类表位结合的预测至关重要,并且已经设计了几种利用氨基酸取代矩阵的免疫信息策略来开发预测算法。与此同时,计算和统计工具已经发展到可以处理多变量和大变量分析,但这些工具尚未系统地应用于 MHC 结合的预测。偏最小二乘分析、主成分分析和相关回归技术已成为许多领域处理复杂数据集的标准。二十多年前,Wold 及其同事证明氨基酸的主要成分可用于预测肽与细胞受体的结合。我们已将这一观察结果应用于 MHC 结合分析,并推导适用于整个蛋白质组规模的预测方法。结果:我们表明,通过使用市售软件,可以利用氨基酸主成分和偏最小二乘法来可视化 MHC 结合域的基本理化特性。我们进一步展示了氨基酸主成分在开发 MHC-I 和 MHC-II 分子的线性偏最小二乘和非线性神经网络回归预测算法中的应用。输出的几个可视化选项有助于理解潜在的物理化学特性,能够证实早期关于某些肽残基对 MHC 结合的相对重要性的研究,并且还为 MHC 分子之间的差异提供了新的见解。我们将线性和非线性 MHC 结合预测工具与当前互联网上可用的几种预测工具进行了比较。结论:与网络服务器方法的高度受限的用户交互范例相反,本地计算方法可以使用强大的数学工具对复杂的多维数据进行交互式分析和可视化。我们的工作表明,诸如此类的预测工具可以在广泛使用的 JMP® 平台上构建,可以在台式计算机上的电子表格环境中运行,并且能够以高通量处理蛋白质组规模分析。

Top