国际标准期刊号: 0974-276X
Wouter Ouwerkerk 和 Aeilko H Zwinderman
背景:信使 RNA 的选择性剪接为细胞提供了通过在转录后加工过程中排除或包含外显子来从单个基因创建具有多种功能的蛋白质亚型的机会。重建这些剪接变体对基因表达总量的贡献仍然很困难。
方法:我们引入了使用有限混合模型的选择性剪接重建问题的概率公式,并提供了基于最大似然原理的解决方案。我们的模型基于这样的假设:特定剪接变体中的外显子的预期表达水平对于该变体中的所有外显子来说是相同的,但允许测量误差。在该算法中,患者的表达可以写成剪接变体混合多元高斯密度的数量的加权和。我们通过在 R 中使用 Nelder 和 Mead 优化算法最大化总似然来估计模型参数。为了评估我们的算法,我们比较了六个模型的 AIC/BIC 值:建立了最佳正态混合建模方法,所有外显子均等转录,目前已知的剪接变体,
结果:我们将模型应用于 63 名马凡氏综合征患者的基因/外显子表达数据中与马凡氏综合征相关的三个基因(SLC2A10、TGFβR2 和 FBN1),具有 25、29 和 265 种可能的剪接变异。具有已知剪接变体并辅助来自所有可能剪接变体的高流行剪接变体的模型对于所有三个基因具有最佳的AI C/BI C 值。在 SLC2A10 和 FBN1 中存在一个,在 TGFβR2 中存在两个主要剪接变体。
结论:我们在与马凡氏综合征相关的三个基因中发现了四种可能的新剪接变异体。