临床试验杂志

临床试验杂志
开放获取

国际标准期刊号: 2167-0870

抽象的

通过 TCGA、GTEx 和 GEO 数据库的综合分析,鉴定用于结直肠癌诊断和预后的甲基化驱动生物标志物

曹立超、巴英、金阳*、张和子*

背景:这项工作通过挖掘来自癌症基因组图谱 (TCGA)、基因型组织表达项目 (GTEx) 和基因表达综合(GEO)。

方法:分别使用 TCGA 的 mRNA 表达和 DNA 甲基化数据筛选差异表达基因 (DEG) 和差异甲基化基因 (DMG)。使用 MmethylMix R 软件包进一步鉴定了 CRC 的甲基化驱动基因 (MDG)。随后,利用随机森林(RF)、支持向量机(SVM)和逻辑回归(LR)算法对MDG进行分析,利用TCGA和GTEx的mRNA表达数据建立诊断预测模型作为独立指标。RF 算法被确定为最合适的,并用于构建结合 MDG 的诊断模型,然后由 GEO 的 GSE39582 进行验证。预后生物标志物用于建立风险评分模型,该模型是通过单变量和多变量 Cox 回归分析生成的。而且,

结果: 10 个 MDG 中有 9 个作为独立诊断预测因子表现良好,并且 STK33 和 EPHX4 还被发现与总生存期 (OS) 相关。列线图的结果表明,它是比风险评分模型更好的预后预测模型。

结论:我们的研究结果表明,确定的 MDG 可以作为 CRC 诊断和预后的生物标志物。

Top