国际标准期刊号: 2090-4924
杨天一和 Anne Hee Hiong Ngu
Hadoop 是最流行的分布式大数据处理通用计算平台之一。HDFS是Hadoop实现的分布式文件系统,能够可靠地存储大量数据,同时为Hadoop的数据处理组件提供服务。MapReduce是Hadoop的主要处理引擎。在这项研究中,我们以可扩展的方式为大输入问题规模的众所周知的学习算法——决策树实现了 HDFS 和 MapReduce。评估节点数量和问题大小的计算性能。