蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

进行全基因组关联研究:上位情景

菲利普·库利、内森·加迪斯、拉尔夫·福尔瑟姆和黛安·瓦格纳

本文使用定性关联模型研究了全基因组关联研究 (GWAS) 背景下的上位情景,以评估可靠预测定性表型(即疾病诊断)和一对相互作用基因之间关联的统计模型。我们采用了相对风险的概念,即突变基因型的阳性诊断概率除以不存在风险的概率的比率。

我们使用基于蒙特卡罗的模拟方法来生成与各种可能的上位模型 (EM) 相对应的合成数据。我们的方法考虑了关联强度、非风险人群的疾病患病率,最重要的是,上位基因的遗传模式。我们分析了模拟基因数据,以评估这些个体因素如何影响 GWAS 背景下的统计功效。

使用模拟数据有两个明显的优势。首先,关联影响因素是孤立的,并且可以与影响位点联系起来。其次,我们可以使用任何特定的统计方法来进行评估。模拟数据集提供了一个真值集,用于评估统计方法选择对关联敏感性的影响,并强调了错误在疾病诊断和不正确的基因型分配中的作用。

结果表明,在上位情况下,预测表型和基因型之间关联的最强大的统计方法是同时测试涉及两个相互作用位点的关联的统计模型。这个结果并不令人惊讶,并且已经被其他人报道过。双基因模型比单基因模型能产生更好的关联预测。这项研究的意义是双重的:首先,它结合了最新的新统计方法作为比较分析的一部分,其次,它记录了单基因模型无法预测关联的程度,涉及与构建的表型相关的基因的相互作用。低风险。

Top