生物医学数据挖掘国际期刊

生物医学数据挖掘国际期刊
开放获取

国际标准期刊号: 2090-4924

抽象的

电子病历和基因组学 (eMERGE) 网络中腹主动脉瘤的电子表型分析:算法开发和康斯坦茨信息挖掘器工作流程

肯尼思·M·博思威克、黛安·T·斯梅尔瑟、乔纳森·A·博克、詹姆斯·R·埃尔莫尔、埃文·J·瑞尔、子野、詹妮弗·A·帕切科、大卫·S·卡雷尔、迈克尔·米哈基维奇、威廉·K·汤普森、乔蒂什曼·帕塔克、苏泽特·J·比林斯基、约书亚·C·丹尼詹姆斯·G·林尼曼、佩吉·L·佩西格、阿贝尔·N·科、欧姆里·戈特斯曼、哈普里特·帕尔玛、伊夫蒂哈尔·J·库洛、凯瑟琳·A·麦卡蒂、埃尔维

背景和目标:我们设计了一种算法,用于从电子健康记录中识别腹主动脉瘤病例和控制措施,并在“电子病历和基因组学”(eMERGE) 网络中共享和执行。

材料和方法:结构化查询语言,用于利用“当前程序术语”和“国际疾病分类”代码编写算法脚本,并使用人口统计和遭遇数据将个体分类为病例、对照或排除。该算法在三个 eMERGE 网络站点和一个非 eMERGE 网络站点上使用盲法手动图表审查进行了验证。验证包括对从算法预测中随机选择的相同数量的预测病例和对照进行评估。在三个 eMERGE 网络站点进行验证后,其余 eMERGE 网络站点仅执行验证。最后,该算法在 Konstanz Information Miner 中作为工作流程实现,以图形方式表示逻辑,同时保留中间数据以供在每个节点检查。

结果:该算法显示病例和对照的阳性预测值 (PPV) 分别为 92.8% (CI: 86.8-96.7) 和 100% (CI: 97.0-100)。它在 eMERGE 网络之外也表现良好。将可传输可执行算法实现为 Konstanz Information Miner 工作流程所需的工作量比伪代码实现要少得多,并且确保逻辑符合预期。

讨论和结论:该电子表型分析算法从电子健康记录中识别腹主动脉瘤病例和对照,具有研究目的所需的高病例和对照 PPV,可以轻松传播,并应用于高通量遗传和其他研究。

Top