猪charaarray的大小是多少

时间:2016-11-09 09:58:50

标签: hive apache-pig

我在Hive中有一个字符串列,其中包含邮件(作为一个段落)。我想处理这些列进行文本挖掘。它不会将数据视为空值。猪chararray有任何限制。请建议我为了这个任务。谢谢

1 个答案:

答案 0 :(得分:0)

您似乎想要使用chararray,但实际上数据被强制为double。这可能是显式或隐式发生的(例如,当您尝试使用MAX之类的数字函数时)。

尝试将代码减少到最小,然后在每个步骤后执行转储并调试以下步骤,直到获得成功:

  1. 加载数据,确保使用正确的数据类型(检查它是否仍然是一个chararray(如果它已经被转换为double,它不应该显示任何文本))
  2. 做一个描述,如果你的专栏还没有chararray把它投到chararray(并检查结果)
  3. 执行字符串操作(并检查结果)
  4. 写入您的输出