蛋白质组学与生物信息学杂志

蛋白质组学与生物信息学杂志
开放获取

国际标准期刊号: 0974-276X

抽象的

GeneNarrator:挖掘文献组以了解基因之间的关系

丁静、Daniel Berleant、徐军、Kenton Juhlin、Eve Wurtele 和 Andy Fulmer

微阵列和其他基因组技术的快速发展现在使生物学家能够在一次实验中监测数百甚至数千个基因的表达。解释表达模式的生物学意义仍然在很大程度上依赖于生物学家的领域知识,以及从文献和各种公共数据库收集的信息。然而,单个专家的领域知识不足以应对大型数据集,并且从文献和/或公共数据库中手动收集和分析这些信息既乏味又耗时。因此,非常需要计算机辅助功能分析工具。

我们描述了 GeneNarrator 的架构,这是一个用于微阵列数据功能分析的文本挖掘系统。该系统的主要目的是测试基于详细解释的两阶段集群策略的更通用系统架构的可行性。给定基因列表,GeneNarrator 从 PubMed 收集有关它们的摘要,然后在第一个聚类阶段将摘要聚类为功能主题。在第二个聚类阶段,基因根据其跨主题出现分布的相似性被聚类成组。这种新颖的两阶段架构是该项目的主要贡献,具有单阶段集群无法轻易提供的优势。

Top