国际标准期刊号: 2090-4924
吴晓伟、朱红晓
芯片比较基因组杂交(CGH)已广泛用于检测基因组拷贝数变异(CNV)。阵列 CGH 数据分析的中心目标是准确检测代表 DNA 拷贝数相对变化的对数强度比的同质区域。近年来已经提出了各种方法。然而,大多数方法不考虑相邻探针测量的相关性,并且通常设计用于在单个样本水平上进行分析,而不是检测多个样本之间常见或重复出现的 CNV。我们提出了一种基于贝叶斯分段的方法来有效分析阵列 CGH 数据。所提出的方法基于简单的假设,但足够通用以适应探针测量之间的各种空间相关性。它还允许使用具有重复 CNV 的多个样本,因此能够跨样本借用力量。与在同一贝叶斯框架中开发的另一种基于探针的方法相比,基于分段的方法以更合适的方式参数化平均对数强度比,这导致了基于可逆跳跃马尔可夫链蒙特卡罗的后验采样方案。我们进行了仿真研究来比较这两种方法以及常用的循环二值分割方法和贝叶斯隐马尔可夫模型方法。与基于探针的方法相比,基于分段的方法实现了更好的估计精度和更高的计算效率,并且与其他两种方法相比也提供了改进的结果,特别是对于信噪比相对较低和高相关性的数据。