你知道任何python mapreduce准备好的群集库吗?
我在Java中发现了一些好的库(http://lucene.apache.org/mahout/),但我更喜欢使用python。
http://wiki.github.com/klbostee/dumbo/(Python mapreduce API)
编辑--- 我正在寻找mapreduce准备好:Canopy,K-means,Means-shift等。
答案 0 :(得分:3)
如果您愿意,可以将Python与Hadoop结合使用:
http://www.michael-noll.com/wiki/Writing_An_Hadoop_MapReduce_Program_In_Python