在Weka 3.7.13中是否有办法加载UTF-8编码文件而不将其转换为ANSII?
我正在尝试加载包含字符串属性的csv文件,其值可以包含表情符号,我不需要丢失它们。
答案 0 :(得分:3)
很有可能这样做。请参阅此link,它介绍了如何从命令行或GUI执行此操作。
如果使用命令行-Dfile.encoding=utf-8
,请添加此参数。
如果使用GUI,则编辑RunWEKA.ini
文件。将fileEncoding
占位符更改为utf-8
。
答案 1 :(得分:0)
为了完整起见,如果您以编程方式使用weka,则需要将IDE
的编码更改为utf-8
才能处理utf-8
编码数据。