标签: python mapreduce mincemeat
我打算在~100GB文件上使用mincemeat.py来执行map reduce任务。在看到来自mincemeat的示例代码之后,似乎我需要输入内存中的字典作为数据源。那么,提供我的庞大文件作为mincemeat的数据源的正确方法是什么?
链接到百果馅:https://github.com/michaelfairley/mincemeatpy
答案 0 :(得分:0)
看看这个例子和概念,我认为你理想的是: