蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

蛋白质组学研究中基于异常值的差异表达分析

Huy Vuong、Kerby Shedden、Yashu Liu 和 David M Lubman

癌症生物标志物研究的一个活跃领域是开发统计方法来识别反映受影响个体癌症异质性的表达特征。汤姆林斯等人。[5]观察了几种癌症类型中癌基因激活的异质模式,并引入了一种称为癌症异常值分析(COPA)的统计方法来识别“癌症异常值基因”。此后已经开发了几种相关的统计方法,但这些程序的操作特征(例如功效、假阳性率)尚未完全表征,特别是在蛋白质组学环境中。在这里,我们使用模拟来确定差异表达的离群值模式必须保持的程度,以便基于离群值的方法比基于均值的方法更有效。我们还提出了一种诊断程序,用于表征表达值分布尾部和中心的差异表达水平可能不相等。我们发现,对于蛋白质组学研究典型的样本量和效应大小,异常值模式必须很强,以便基于异常值的分析能够提供有意义的益处。对黑色素瘤研究的蛋白质组学数据的分析证实了这一点,其中差异表达最常见于整个分布,而不是集中在尾部,尽管少数蛋白质显示出与异常表达一致的表达模式。我们发现,对于蛋白质组学研究典型的样本量和效应大小,异常值模式必须很强,以便基于异常值的分析能够提供有意义的益处。对黑色素瘤研究的蛋白质组学数据的分析证实了这一点,其中差异表达最常见于整个分布,而不是集中在尾部,尽管少数蛋白质显示出与异常表达一致的表达模式。我们发现,对于蛋白质组学研究典型的样本量和效应大小,异常值模式必须很强,以便基于异常值的分析能够提供有意义的益处。对黑色素瘤研究的蛋白质组学数据的分析证实了这一点,其中差异表达最常见于整个分布,而不是集中在尾部,尽管少数蛋白质显示出与异常表达一致的表达模式。

Top