生物医学数据挖掘国际期刊

生物医学数据挖掘国际期刊
开放获取

国际标准期刊号: 2090-4924

抽象的

用于 BLAST 输出的 ncRNA 序列重建和潜在同源物结构表征的管道

施瓦茨 M 和帕内克 J

抽象的

BLAST 计算被许多研究用作探索性 RNA 排列搜索工具。它非常有价值,但它的输出基本上只包含分组数据,这不足以描述排列部分。随后,我们建立了一个管道来识别部分的总体分组,预见主题排列的辅助设计并收集它们与问题 RNA 的同源性。该流程包含几个阶段:1)通过安全的 Locarna 计算重建 BLAST 命中,2)通过 RSEARCH 计算推测与问题 RNA 的同源性,3)通过质心同倍计算预测辅助设计。通过扩大 BLAST 产量记住的数据,我们的流程可用于整体描绘 ncRNA。此外,

通过 BLAST 或类似工具在数据库中搜索相似序列是一般应用的最常见的生物信息学任务之一,并且适用于非编码 RNA。然而,由于存在与数据库主题序列的部分匹配,搜索结果可能难以解释。在这里,我们提出了 rboAnalyzer – 一种帮助解释序列搜索结果的工具,通过 (1) 将部分匹配扩展到可能的全长主题序列,(2) 预测全长主题序列表示的 RNA 与查询 RNA 的同源性,( 3)池化在搜索结果和 Rfam 等公共数据库中找到的同源 RNA 信息,以预测所有匹配的更可靠的二级结构,以及 (4) 通过在丰富的图形输出中提供预测结果和其他相关信息来将匹配置于上下文中。使用预测的全长匹配可以改进二级结构预测,并使 rboAnalyzer 在同源性识别方面更加稳健。该工具的输出应帮助用户可靠地表征 BLAST 输出中的非编码 RNA。rboAnalyzer 的实用性及其正确地将部分匹配扩展到全长的能力在已知的同源 RNA 上得到了证明。为了允许用户使用自定义数据库和搜索选项,rboAnalyzer 接受任何搜索结果作为 BLAST 格式的文本文件。主要输出是一个交互式 HTML 页面,显示计算出的特征和匹配的其他上下文。输出还可以以适当的序列和/或二级结构格式导出。

Top