国际标准期刊号: 1745-7580
凯伦·B·马洛尼和弗拉基米尔·布鲁西克
背景:可公开访问的在线注册中心提供了大量有关临床试验的信息。信息技术和数据交换标准能够快速提取、总结和可视化信息以及从这些数据集中派生的知识。临床试验数据以 XML 格式从国家医学图书馆 ClinicalTrials.gov 网站提取。此数据包括“目的摘要”、“试验主办方”、“试验阶段”、“招募状态”和“地点”等类别。我们重点关注了 645 项与癌症疫苗相关的临床试验。有关癌症类型的其他事实,包括发病率和生存率,是从国家癌症研究所监测数据中检索到的。结果:该应用程序能够快速提取有关机构、疾病、临床方法、临床试验日期、试验中的主要癌症类型、临床机会和药品市场覆盖范围的信息。可视化工具有助于结果的呈现,这些工具总结了正在进行和已完成的癌症疫苗试验的情况。我们的摘要显示了主要申办者随时间推移、按阶段进行的每种癌症类型的临床疫苗试验数量,以及与癌症类型和生存数据相关的试验活动。我们还发现了在癌症疫苗领域被忽视的癌症:膀胱癌、肝癌、胰腺癌、胃癌、食道癌以及所有低发病率癌症。结论:我们开发了一种数据挖掘方法,可以从主要临床试验存储库中快速提取复杂数据。