我在Weka中很新。
我想知道,Weka是否有可能对Weka中包含不同属性的2个不同数据库进行分类?
示例:
数据集A:@attributes {UserID,Tags,Descriptions} @数据 a,#user,写书
数据集B:@属性{UserID,经度,纬度,日期} @数据 xyz,7895231,453221.1,28.10.2012
是否可以将具有不同属性的数据集A和B合并到Weka中的1个数据集中?有人告诉我,在Weka分类之前我可以在excel中手动合并它,但我在徘徊Weka如何读取数据?是一排一排吗?放入这些形式(excel)并将值0置于逻辑上是否合乎逻辑?
数据集AB:用户ID,标签,描述,用户ID,经度,
纬度,日期
a, #user, writing books, 0, 0,0
xyz, 0, 0 , 7895231, 453221.1, 28.10.2012
答案 0 :(得分:0)
是。这篇文章对此进行了介绍: https://list.waikato.ac.nz/pipermail/wekalist/2009-April/043232.html 这还包括您想要附加两个文件(添加实例)的情况。
这是在Weka命令行界面(CLI)中完成的。 这方面的一个技巧是似乎有一个行长度限制,所以将你的文件移动到默认目录(似乎是Program Files / Weka-3-8),所以你不会遇到问题路径。
假设我们有文件"合并A.arff"由
组成@relation 'merge A'
@attribute UserID numeric
@attribute A1 {Joe,Bill,Larry}
@attribute A2 numeric
@attribute Aclass {pos,neg}
@data
1,Joe,17,pos
3,Joe,42,neg
5,Bill,8,neg
7,Larry,4,neg
和文件"合并B.arff"由
组成@relation 'merge B'
@attribute BUserID numeric
@attribute Blong numeric
@attribute Blat numeric
@data
1,-180,42
3,-182,45
5,-179,36
7,-184,38
然后,如果您打开CLI并在>之后键入以下内容:提示
java weka.core.Instances merge "merge A.arff" "merge B.arff"
以下内容将被转储到控制台:
@relation 'merge A_merge B'
@attribute UserID numeric
@attribute A1 {Joe,Bill,Larry}
@attribute A2 numeric
@attribute Aclass {pos,neg}
@attribute BUserID numeric
@attribute Blong numeric
@attribute Blat numeric
@data
1,Joe,17,pos,1,-180,42
3,Joe,42,neg,3,-182,45
5,Bill,8,neg,5,-179,36
7,Larry,4,neg,7,-184,38
出于某种原因,我无法直接将其传送到另一个文件,例如
java weka.core.Instances merge "merge A.arff" "merge B.arff" > "output.arff"
要么它没有创建文件,要么我无法找到它创建它的位置。但一次只有一个问题!