标签: hive apache-pig
我在Hive中有一个字符串列,其中包含邮件(作为一个段落)。我想处理这些列进行文本挖掘。它不会将数据视为空值。猪chararray有任何限制。请建议我为了这个任务。谢谢
答案 0 :(得分:0)
您似乎想要使用chararray,但实际上数据被强制为double。这可能是显式或隐式发生的(例如,当您尝试使用MAX之类的数字函数时)。
尝试将代码减少到最小,然后在每个步骤后执行转储并调试以下步骤,直到获得成功: