蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

GDF:处理医学和人口遗传应用的高通量基因分型多平台数据

豪尔赫·阿米戈、安东尼奥·萨拉斯、哈维尔·科斯塔斯和安赫尔·卡拉塞多

背景:最近出现了许多不同的高通量基因分型平台。这些平台生成大量基因分型数据,随后对其进行处理并存储在公共和/或私人数据库中。不同实验室使用的平台多种多样,而且生成的数据量很大,这给大多数实验室的数据管理带来了严重的问题。目前可用的一些公共或私人软件包解决了一些重要需求,但它们从研究人员可能不共享的角度处理数据,并且可能无法对结果进行监督(例如基因分型不一致或基因分型数据的摘要)。被执行。

结果:基因分型数据过滤器 (GDF) 软件的主要目标是允许研究人员在本地管理由最标准的基因分型平台生成的大量基因型,获取基因分型实验的统计数据和摘要,同时维护其隐私。GDF还允许用户对数据进行监督,以便研究人员可以轻松评估重要参数,包括样本中缺失数据的比例和单核苷酸多态性(SNP)、Hardy-Weinberg平衡等。此外,GDF将原始数据解析为医学和人口遗传应用中经常使用的流行软件包中需要不同的文本格式作为输入文件。

结论: GDF 是一个 Perl 程序,可以有效地处理来自各种基因分型平台的数据,使研究人员能够轻松检查自己的基因分型数据,并将其解析为各种众所周知的专业分析软件。它已准备好在最常见的情况下通过用户友好的 Web 界面运行,但它也可以作为本地脚本在个人计算机上运行,​​甚至在超大型项目的超级计算机上运行。

Top