标签: hadoop mapreduce
我正在研究一个使用map reduce程序生成随机数据的用例,我不需要HDFS中的任何输入文件。如果我不给输入路径MR程序不起作用。所以,目前我有一个虚拟输入文件。有什么方法可以避免这种情况吗?
答案 0 :(得分:2)
通常,MR程序有某种数据需要处理。但是,可能存在像Random Generation这样的场景,其中没有数据需要处理。签出TeraGen程序以获取随机数生成,其中包含行数和输出目录作为输入。另外,我还没有试过DataGenerator,但看起来很有趣。