我在Python中编写了mapreduce作业。在我把它放在EMR之前,我想在本地进行测试。
目前我知道测试的唯一方法是运行命令:
cat input_file | python mapper.py | sort -k 1,1 | python reducer > output_file
但管道对我来说有点吓人,因为如果有什么中断我不知道(除了检查这个命令的退出代码)。
是否有更优雅/ pythonic的方式来运行mapreduce并检查它是否成功运行(所以我可以捕获一个特定的异常并处理它)?
谢谢