国际标准期刊号: 0974-276X
卡罗琳·特朗泽、德尔菲娜·莫科特-布尔奇和帕斯卡·罗伊
背景:专门用于临床蛋白质组学的质谱分析等高通量分析为临床研究提供了新的见解。这项有前途的技术可以生成具有大量生物输入的高维数据集。使用这些高维数据集给统计方法带来了挑战,当前的统计分析仍然存在弱点,必须克服这些弱点才能准确解释“组学”研究。核心问题是可靠地鉴定新的预后和诊断生物标志物。尽管在之前的研究中已经观察到,但这些新标记物的识别和验证机制尚未得到充分解释,并且常常相互分离。
结果:因此,我们研究的目的是展示有时如何在鉴定研究中选择候选标记,因为对其效果的估计存在偏差。为了实现这一目标,这项工作是通过模拟有关生存的高维研究来进行的。我们展示了识别研究中涉及的选择机制如何影响称为均值回归的机制。这反过来会导致对效应大小的估计存在偏差,从而在考虑验证研究时产生乐观情绪。
结论:这项研究证明了为什么只有通过精心设计的研究(依赖于一致的样本量进行识别步骤)才能发现新的稳健标记。由于上述识别和验证机制,高维临床研究中的相关候选生物标志物需要无偏估计,这从识别步骤开始。只有这样,它才能带来一致的研究,从而在医疗保健方面获益。