具有关系属性的(稀疏)ARFF的CSV输入文件格式

时间:2015-02-19 09:22:16

标签: csv machine-learning nlp weka arff

我想在WEKA中进行其他处理之前将CSV文件转换为ARFF格式(使用CSVToARFFConverter)。 我的ARFF文件格式如下:

@relation Sample

 @attribute CLS string
 @attribute SCLS string
 @attribute key relational
   @attribute key1 string
   @attribute key2 string
   @attribute key3 string
 @end key
 @attribute class {-5,-4,-3,-2,-1,0,1,2,3,4,5}


@data
{0 type, 1 beta, 2 "3 keyword1\nkeyword2\nkeyword3", -5}
{0 typeA, 1 gamma, 2 "3 keyword11\nkeyword21\nkeyword31", 0}
{0 typeB, 1 alpha, 2 "3 keyword21\nkeyword22\nkeyword23", 3}

上述稀疏ARFF文件的等效CSV表示形式是什么?请协助。感谢。

1 个答案:

答案 0 :(得分:0)

我不知道我是否理解你的问题,但如果你已经有了arff文件,你为什么需要输入csv?只需在weka中使用arff。

等效的CSV表示可能是以下之一:

CLS, SCLS, key1, key2, key3, class
0 type, 1 beta, keyword1\n, keyword2\n, keyword3, -5
0 typeA, 1 gamma, keyword11\n, keyword21\n, keyword31, 0
0 typeB, 1 alpha, keyword21\n, keyword22\n, keyword23, 3

CLS, SCLS, key, key1, key2, key3, class
0 type, 1 beta, 2, keyword1\n, keyword2\n, keyword3, -5
0 typeA, 1 gamma, 2, keyword11\n, keyword21\n, keyword31, 0
0 typeB, 1 alpha, 2, keyword21\n, keyword22\n, keyword23, 3

CLS, SCLS, key, class
0 type, 1 beta, keyword1\n;keyword2\n;keyword3\n, -5
0 typeA, 1 gamma, keyword11\n;keyword21\n;keyword31\n, 0
0 typeB, 1 alpha, keyword21\n;keyword22\n;keyword23\n, 3

阅读关于csv

中关系的内容

http://en.wikipedia.org/wiki/Comma-separated_values#General_functionality

希望它可以帮到你