生物医学数据挖掘国际期刊

生物医学数据挖掘国际期刊
开放获取

国际标准期刊号: 2090-4924

抽象的

一种基于传记属性的医生搜索和排名方法

朱梅琳达

我们描述了一种使用从公共网站上的非结构化自然语言文本中提取的信息为医生构建可搜索数据库的方法。具体来说,我们关注医生的传记属性,例如医生所在的医学院、本科院校和学位、年龄、医学专业、有关某些类型病症的出版物(及其引用频率)、相关媒体报道等。医学院的排名信息基于平均 MCAT 分数和 GPA 可以用作搜索参数来提供搜索结果的排名。研究出版物的引用以及医生的名字与特定类型的医疗状况相关联的频率也可以用于排名目的。对特定医生的治疗结果缺乏任何个人了解,寻求优质护理的患者可以通过根据其教育背景、经验和专业知识排名的潜在提供者列表获得最好的帮助。由于我们必须从互联网上收集大部分信息(主要由基于非结构化 HTML 的文本组成),因此查找特定信息并将其在数据库中分类需要基于自然语言的模式识别算法,该算法可以学习并与某些医学术语相关联,以及提取有关教育背景和专业经验的信息。我们认为,类似的想法可以应用于许多其他搜索任务,这些任务可以从非结构化网页构建的分类数据库中受益。

Top