标签: weka text-mining arff sparse-file
我有一个通过使用Weka生成的稀疏格式的arff文件。属性名称也是数字。 因此,ARFF文件中的@data部分看起来像这样:
@date {452 1,520 1,789 1,827 1,877 1,917 1,1187 1,1190 1,1359 1,1465 1,1471 2,1703 1,1801 1.2204 1.2316 1.2376 2.2789 1.3623 1}
如何以这种方式管理稀疏文件以另一种格式保存它,或者例如对属性进行汇总以获得整个文件的总频率?