如何在Weka中从数据库加载数据集时声明类

时间:2012-09-13 19:49:58

标签: database weka class-attribute

我试图了解在从数据库而不是文件加载数据时,如何在Weka中表达以下.arff文件。 .arff文件具有以下形式:

@relation sample
@attribute expression string
@attribute tone {postive,negative}

@data
'this is a happy message', positive
'this is an unhappy message', negative

在从数据库加载数据的情况下,包含一个包含两个字段的表 - 表达式和音调 - ,我怎样才能让weka知道场色调只有两个可能的值,正面还是负面?

这两个字段都是字符串。我想在表达式上应用NominalToString过滤器将其转换为String并应用StringToWord过滤器。但是由于音调属性,它无法完成...... 任何解决方案?

2 个答案:

答案 0 :(得分:0)

“但由于音调属性无法完成......” - 我不明白为什么。您只能处理'表达式'字段。您可以有选择地对所需的任何属性应用NominalToString。检查setAttributeIndexes功能。

答案 1 :(得分:0)

之前我问same question。您可能会在该问题中看到详细的答案和必要的代码。

简短回答:您合并来自外部文件的正确arff头与来自数据库的数据。