在mapper中创建和映射键值是不好的做法?

时间:2014-02-23 12:15:58

标签: hadoop mapreduce cassandra

我想问一下,在我们的mapper类中拆分或制作键值对是不是很糟糕的编程习惯,而是创建它的独立可写类?

我有10K密钥,它们的值是字符串格式, 我正在执行我的拆分内部映射器,它好吗?还是不好? 如果不好那么为什么?如果没有,那么在什么情况下会不好?

1 个答案:

答案 0 :(得分:0)

这不是一个好的编程习惯。实际上,框架的设计必须遵循上述规则和指南。如果键和值类不可写,则程序将无法编译并返回错误。

The key and value classes have to be serializable by the framework and hence need to 
implement the Writable interface. Additionally, the key classes have to implement the 
WritableComparable interface to facilitate sorting by the framework.

因此,出于这个原因,您不能将String用作键类。相反,您可以使用文本。 您也可以访问本教程以查看更多教程(http://hadoop.apache.org/docs/stable1/mapred_tutorial.html