国际标准期刊号: 1745-7580
马修·阿迪托、乔安娜·富约、瑞安·塔松、弗朗西斯·特里、克里斯汀·达席尔瓦、张松华、威廉·马丁、安妮·S·德·格鲁特、史蒂文·F·莫斯和伦纳德·莫伊斯
背景模式匹配算法的一项有用应用是识别主要组织相容性复合体 (MHC) 配体和 T 细胞表位。与 MHC 分子结合并与 T 细胞受体相互作用以刺激免疫系统的肽是抵御传染性病原体的关键抗原。我们描述了一种幽门螺杆菌疫苗设计的基因组到疫苗的方法,该方法利用免疫信息学算法从大型基因组数据集中快速识别 T 细胞表位序列。结果为了设计全球相关的疫苗,我们使用计算方法从来自世界各地的七种遗传和表型多样化的幽门螺杆菌菌株中识别出由 676 个开放阅读框 (ORF) 组成的核心基因组。在由这些 ORF 编码的 1,241,153 个 9 聚体序列中,有 106,791 个在所有七个基因组中是相同的,并且当通过 EpiMatrix 评估时,有 23,654 个在八个原型 II 类 HLA 等位基因中的至少一个的预测 HLA 配体中得分最高的 5%。为了最大化可通过实验评估的表位数量,我们使用计算算法通过将潜在免疫原性的 9 聚体组装到与天然蛋白抗原中相同的位置来增加 20-25 个氨基酸片段中的表位密度。生成了 1,805 个免疫原性共有序列 (ICS)。
结论通过计算评估幽门螺杆菌基因组数据集的广度,以快速、仔细地确定一组核心基因。免疫信息学工具对该基因集的应用准确预测了表位,这些表位对于基于 T 细胞的疫苗开发具有良好的特性。