应用错误收集

读取文件

时间：2017-02-17 15:16:11

标签： windows dataset weka

在尝试将机器学习实施到我的项目中时，我使用了WEKA。为了训练和测试它，weka处理俄语数据的收集。但在阅读过程中，它显示出不可读的（'Ð§Ñ，Ð¾Ñ'）字符。我知道这是由于语言配置错误，但我无法找到解决方案。任何帮助都是适当的

WEKA UI screenshot

我给了java 1.8，weka 3.8。我的数据集如下：“Российскийситком（ситуационнаякомедия）«Интерны»，совмещеннаяадаптация«Клиники»и«ДоктораХауса»” 我的文件夹就像：

-kino1tr： -好 -坏 - 零排放

1 个答案:

答案 0 :(得分：0)

我犯了愚蠢的错误。在加载数据时，有charSet字段来指定语言配置。因此，在charset中声明UTF-8可以解决问题