Weka StringToWordVector过滤器中可以使用哪种文本文件

时间:2014-03-08 22:17:00

标签: java filter weka

我知道文本文件应该转换为arff文件,但我很困惑文本文件中的内容是什么?它完全是一个字符串,比如“我是java”,或者像这样

@relation 

@attribute  numerical
@attribute  numerical

@data

文字内容“我是java”

1 个答案:

答案 0 :(得分:1)

您可以轻松地从包含实例(在raws中)和功能(或属性)值(在列中)的电子表格转换为ARFF。 ARFF文件的大部分由实例列表组成,每个实例的属性值用逗号分隔。大多数电子表格和数据库程序允许您将数据以逗号分隔值(CSV)格式导出到文件中,作为带有逗号的记录列表。完成此操作后,您只需将文件加载到文本编辑器或文字处理器中;使用@relation标记添加数据集的名称,使用@attribute添加属性信息,以及@data行;然后将文件保存为原始文本。或者在WEKA explorer中上传你的csv文件(预处理(打开文件为csv),然后将其保存为arff。