免疫组学研究

免疫组学研究
开放获取

国际标准期刊号: 1745-7580

抽象的

基于聚类的克隆相关免疫球蛋白基因序列集的鉴定

陈志良、Andrew M Collins、王岩、Bruno A Gaeta

背景: B 淋巴细胞的克隆扩增与体细胞突变和抗原选择相结合,使哺乳动物的体液免疫系统能够产生高度特异性的免疫球蛋白 (IG) 或抗体,以对抗入侵的细菌、病毒和毒素。高通量 DNA 测序方法的出现为研究这种克隆扩增和识别指导抗体生成的因素提供了新的途径。免疫球蛋白基因序列比对和分区软件的可用性有助于识别来自非常大的序列集中的相同重排(克隆相关集)的重排免疫球蛋白基因序列组,该软件可以准确预测组成种系基因​​,但需要艰苦的目视检查和序列分析。

结果:我们开发并实施了一种算法,用于识别大型人免疫球蛋白重链基因可变区序列集中的克隆相关序列集。该程序处理已使用 iHMMune-align 划分的序列,并使用 CDR3 序列的成对比较以及 IGHV 和 IGHJ 种系基因分配的相似性来构建距离矩阵。然后使用凝聚层次聚类来识别可能的克隆相关序列组。该程序可从 http://www.cse.unsw.edu.au/~ihmmune/ClonalRelate/ClonalRelate.zip 下载。

结论:该方法在多个基准数据集上进行了评估,与领域专家的目视检查相比,该方法可以更准确、更快地识别克隆相关免疫球蛋白基因序列。

Top