国际标准期刊号: 2471-9315
巴奇·辛格
人类基因组计划的成功带动了基因组测序数据的激增。这与下一代测序一起有助于降低测序成本,从而进一步增加了对这种大型基因组数据分析的需求。该数据集及其处理有助于医学研究。
因此,我们需要专业知识来处理生物大数据。因此需要云计算的概念和大数据技术(例如 Apache Hadoop 项目)来存储、处理和分析这些数据。因为,这些技术提供分布式和并行数据处理,甚至可以有效地分析 PB 级数据集。然而,也有一些缺点,主要包括需要更长的时间来传输数据和更少的网络带宽。