如何处理Weka J48的名义数据

时间:2014-11-12 07:58:56

标签: binary-tree weka decision-tree

当我用二进制拆分选项运行weka的J48时,建立了这样的决策树。

http://www.fastpic.jp/viewer.php?file=2693704973.jpg

输入解释变量是1个名义数据,由问题ID +答案ID生成。 1个名义数据,1个交易。 我想知道为什么这棵树只在一边。

是由我的数据集或表定义还是原始二进制拆分方式引起的? 我希望树两边都有节点。

如果您知道这样的选择,请告诉我。


!示例数据!请忽略点'·'

  • USR,QA,类
  • A,11,1
  • A,21.1
  • A,31,1
  • B,12,2
  • B,22,2
  • B,32,2
  • C,13,3
  • C,23,3
  • C,33,3
  • d,11,4
  • d,22,4
  • d,31,4
  • E,11,1
  • E,23,1
  • E,31,1
  • 女,12,2
  • 女,22,2
  • 女,33,2
  • G,13,3
  • G,22,3
  • G,32,3
  • H,12,4
  • H,21,4
  • H,33,4

1 个答案:

答案 0 :(得分:1)

构建的树中没有错误,没有选项可以真正修改它。如果您的问题与您的同一个Akinator项目有关,请重新格式化您的数据,以便在同一实例/行上获得所有问题(即11,21,31),并将答案作为目标类。

PS:如果您将这些数据导入为CSV,Weka会将这些数据作为数字(而非标称数据)。然后,您应该添加一个非数字字符(即#1,#2,#3 ......),以便Weka将这些数据视为名义上的。