糖类组学与脂质组学杂志

糖类组学与脂质组学杂志
开放获取

国际标准期刊号: 2153-0637

抽象的

用于研究和开发的大数据

亚历克斯·V·瓦森科夫

本演讲将重点讨论大数据用于研究与开发 (R&D)。大数据有多种定义,这些定义造成了对该主题的混淆。对于合成大数据的定义更加混乱,合成大数据可以定义为研究文章、博士论文、专利、测试报告和产品描述报告的集合。此类数据具有海量、高速度、多样性和准确性等新兴属性,这使得对合成数据的分析变得困难。迫切需要一个能够将搜索或信息检索 (IR) 与信息提取 (IE) 协同集成的框架。传统的基于 IR 的文本搜索可用于快速探索大量合成数据。然而,这种方法无法在此类集合中找到特定的研发概念并在这些概念之间建立联系。此外,IR 模型缺乏学习概念和概念之间关系的能力。相比之下,IE 模型过于具体,通常需要针对感兴趣的领域进行定制。将提出一个新颖的框架,并展示其挖掘合成数据的可行性。人们发现可以部分或完全自动分析合成数据以查找标记信息和连接概念。本框架可以帮助个人识别研发问题的非显而易见的解决方案,作为创新的输入,或对与相关技术概念或专利申请相关的现有技术进行分类 IR 模型缺乏学习概念和概念之间关系的能力。相比之下,IE 模型过于具体,通常需要针对感兴趣的领域进行定制。将提出一个新颖的框架,并展示其挖掘合成数据的可行性。人们发现可以部分或完全自动分析合成数据以查找标记信息和连接概念。本框架可以帮助个人识别研发问题的非显而易见的解决方案,作为创新的输入,或对与相关技术概念或专利申请相关的现有技术进行分类 IR 模型缺乏学习概念和概念之间关系的能力。相比之下,IE 模型过于具体,通常需要针对感兴趣的领域进行定制。将提出一个新颖的框架,并展示其挖掘合成数据的可行性。人们发现可以部分或完全自动分析合成数据以查找标记信息和连接概念。本框架可以帮助个人识别研发问题的非显而易见的解决方案,作为创新的输入,或对与相关技术概念或专利申请相关的现有技术进行分类 将提出一个新颖的框架,并展示其挖掘合成数据的可行性。人们发现可以部分或完全自动分析合成数据以查找标记信息和连接概念。本框架可以帮助个人识别研发问题的非显而易见的解决方案,作为创新的输入,或对与相关技术概念或专利申请相关的现有技术进行分类 将提出一个新颖的框架,并展示其挖掘合成数据的可行性。人们发现可以部分或完全自动分析合成数据以查找标记信息和连接概念。本框架可以帮助个人识别研发问题的非显而易见的解决方案,作为创新的输入,或对与相关技术概念或专利申请相关的现有技术进行分类

Top