国际标准期刊号: 2379-1764
休·沙纳汉、安德鲁·哈里森和肖恩·托比亚斯·梅
大型、公开的数据集为低收入和中等收入国家 (LMIC) 的研究人员带来了挑战和机遇。这些研究人员面临的挑战是,鉴于网络连接和基础设施较差,如何利用这些数据集。机会是能够使用这些数据集进行前沿研究,从而避免在生成数据集时投入大量资源。其后果将是为这些国家遇到的重大当地问题找到解决方案,并培养一支受过教育的数据科学劳动力队伍。尤其是云计算很可能缩小这里的基础设施差距。在本文中,我们讨论了我们在中国、纳米比亚和马来西亚教授各种生物信息学数据密集分析暑期学校的经验。根据这些经验,我们建议在中低收入国家举办更多的数据科学和云计算暑期学校,以培养一批数据科学家来启动这一进程。最后,我们讨论了提供云计算资源的可能性,其中使用成本受到控制,以便中低收入国家研究人员能够负担得起。