索引csv文件时出错

时间:2014-02-19 12:02:47

标签: exception csv indexing forge endeca

我正在尝试在Endeca中索引csv文件。在行长度小于65536的情况下,索引工作正常。对于大数据,它会抛出异常。

FATAL 02/18/14 15:45:53.122 UTC(1392738353122)FORGE {baseline}:TextObjectInputStream:在阅读“/opt/soft/endeca/apps/MyApp/data/processing/TestRecord.csv”时,分隔符“ “在65536个字符的允许距离内找不到。 ............................................. ..... ......................................... ERROR 02/17/14 16:10 :58.060 UTC(1392653458060)FORGE {baseline}:I / O异常:从Java读取数据时出错:抛出EdfException:edf / src / format / Shared / TextObjectInputStream.cpp:76。消息是:退出调用

如何在Endeca中增加此限制以索引大数据(单行数超过65537)?

1 个答案:

答案 0 :(得分:0)

我想你已经解决了这个问题。如果没有,则错误是在记录适配器中未正确设置行分隔符时。

如果您的记录在CSV文件中合法地长,请切换到XML或其他内容。