读取文件

时间:2017-02-17 15:16:11

标签: windows dataset weka

在尝试将机器学习实施到我的项目中时,我使用了WEKA。为了训练和测试它,weka处理俄语数据的收集。但在阅读过程中,它显示出不可读的('ЧÑ,оÑ')字符。我知道这是由于语言配置错误,但我无法找到解决方案。任何帮助都是适当的

WEKA UI screenshot

我给了java 1.8,weka 3.8。 我的数据集如下:“Российскийситком(ситуационнаякомедия)«Интерны»,совмещеннаяадаптация«Клиники»и«ДоктораХауса»” 我的文件夹就像:

-kino1tr:    -好    -坏     - 零排放

1 个答案:

答案 0 :(得分:0)

我犯了愚蠢的错误。在加载数据时,有charSet字段来指定语言配置。因此,在charset中声明UTF-8可以解决问题