Weka - 加载UTF-8编码的csv

时间:2015-12-01 16:45:44

标签: java utf-8 weka

在Weka 3.7.13中是否有办法加载UTF-8编码文件而不将其转换为ANSII?

我正在尝试加载包含字符串属性的csv文件,其值可以包含表情符号,我不需要丢失它们。

2 个答案:

答案 0 :(得分:3)

很有可能这样做。请参阅此link,它介绍了如何从命令行或GUI执行此操作。

如果使用命令行-Dfile.encoding=utf-8,请添加此参数。

如果使用GUI,则编辑RunWEKA.ini文件。将fileEncoding占位符更改为utf-8

答案 1 :(得分:0)

为了完整起见,如果您以编程方式使用weka,则需要将IDE的编码更改为utf-8才能处理utf-8编码数据。