标签: multicore data-processing format-conversion
我即将开始一项需要大量数据转换和处理操作的研究项目。一方面,数据相当庞大 - 原始数据集通常为10GB - 因此效率是一个问题。另一方面,许多这些操作将是一次性的,很少重新运行,因此构建可部署的应用程序是一种过度杀伤力。 不是用户应用程序,但主要是实验。
一些特征和限制:
处理此类项目的推荐工具有哪些?我的偏好是:
编程语言不是问题,我可以管理Windows或Linux。谢谢!