国际标准期刊号: 2157-7048
瓦埃尔·穆罕默德·沙赫尔·亚富兹
数据管理的概念是存储、验证和处理所需数据的实践,以便为用户提供数据的可访问性和可靠性。数据源涵盖网络和社交服务、物联网、传感、任何在线组织的交易、机器等。这些海量的数据可以在服务器中找到,分为结构化、非结构化和半结构化。此外,这些数据存储的类别很少,例如基于图形、基于文档、基于键值和基于列。数据管理的目的本身并不是目的,而是数据发布过程后创新和知识发现以及集成和重用的关键。许多组织和政府机构开始需要数据管理和各种实验计划。除了收集数据和归档之外,它包括“长期护理”,这是宝贵的数字资产。组织收集非结构化数据,例如内部来源(例如,传感器数据)和外部来源(例如,社交媒体)。因此,数据管理技术和分析的出现使组织能够在其业务和创新流程中处理数据。其中一项技术是面部识别技术,能够获取有关商店客流量、顾客构成和商店移动模式的情报。这些信息对于产品促销、人员配置和布局决策非常宝贵。事实上,传统的数据管理系统假设用户查询时,他们对模式、内容和含义有足够的了解,并且确定了他们想要提出的查询,然后,系统试图产生完整且正确的结果。为了处理结构监测应用中的传感器数据,传统的关系数据库管理系统(RDBMS)采用了传统的关系数据库管理系统(RDBMS),但在数据管理方面很少致力于解决基本问题。为了存储、管理和检索大规模数据,Apache H-Base、Apache Cassandra 和 MongoDB 被称为 NoSQL(不仅仅是 SQL)数据库工具,旨在处理非结构化数据。在灵活性和可扩展性方面,NoSQL 数据库系统比 RDBMS 更重要。对于传感器网络数据的处理和管理,Apache Cassandra从NoSQL系统的海量物联网数据中表现出了更好的可扩展性。Apache Cassandra 还支持大规模数据管理和处理。在这次演讲中,