是否有可能合并两个不同的数据集,这些数据集由weka中的不同属性组成?

时间:2017-10-23 22:44:22

标签: weka

我在Weka中很新。

我想知道,Weka是否有可能对Weka中包含不同属性的2个不同数据库进行分类?

示例:

数据集A:@attributes {UserID,Tags,Descriptions}             @数据              a,#user,写书

数据集B:@属性{UserID,经度,纬度,日期}             @数据             xyz,7895231,453221.1,28.10.2012

是否可以将具有不同属性的数据集A和B合并到Weka中的1个数据集中?有人告诉我,在Weka分类之前我可以在excel中手动合并它,但我在徘徊Weka如何读取数据?是一排一排吗?放入这些形式(excel)并将值0置于逻辑上是否合乎逻辑?

数据集AB:用户ID,标签,描述,用户ID,经度,
              纬度,日期

         a,  #user, writing books, 0, 0,0
         xyz, 0, 0 , 7895231, 453221.1, 28.10.2012

1 个答案:

答案 0 :(得分:0)

是。这篇文章对此进行了介绍: https://list.waikato.ac.nz/pipermail/wekalist/2009-April/043232.html 这还包括您想要附加两个文件(添加实例)的情况。

这是在Weka命令行界面(CLI)中完成的。 这方面的一个技巧是似乎有一个行长度限制,所以将你的文件移动到默认目录(似乎是Program Files / Weka-3-8),所以你不会遇到问题路径。

假设我们有文件"合并A.arff"由

组成
@relation 'merge A'

@attribute UserID numeric
@attribute A1 {Joe,Bill,Larry}
@attribute A2 numeric
@attribute Aclass {pos,neg}

@data
1,Joe,17,pos
3,Joe,42,neg
5,Bill,8,neg
7,Larry,4,neg

和文件"合并B.arff"由

组成
@relation 'merge B'

@attribute BUserID numeric
@attribute Blong numeric
@attribute Blat numeric

@data
1,-180,42
3,-182,45
5,-179,36
7,-184,38

然后,如果您打开CLI并在>之后键入以下内容:提示

java weka.core.Instances merge "merge A.arff"  "merge B.arff"

以下内容将被转储到控制台:

@relation 'merge A_merge B'

@attribute UserID numeric
@attribute A1 {Joe,Bill,Larry}
@attribute A2 numeric
@attribute Aclass {pos,neg}
@attribute BUserID numeric
@attribute Blong numeric
@attribute Blat numeric

@data
1,Joe,17,pos,1,-180,42
3,Joe,42,neg,3,-182,45
5,Bill,8,neg,5,-179,36
7,Larry,4,neg,7,-184,38

出于某种原因,我无法直接将其传送到另一个文件,例如

 java weka.core.Instances merge "merge A.arff"  "merge B.arff" > "output.arff"

要么它没有创建文件,要么我无法找到它创建它的位置。但一次只有一个问题!