Mahout朴素贝叶斯物品分类器

时间:2012-04-17 10:21:19

标签: machine-learning mahout bayesian classification

我正在开展一个项目,我需要将项目分类到某个类别。我有一个文件作为输入;其中包含目标变量空格分隔功能。我的训练数据看起来像

类别名称[Tab] DataString

管道[Tab]管道水龙头塑料管PVC管冷水管热水管三通出口向上弯头向上弯头向下闸阀截止阀

油漆[Tab]象牙色黑色烧焦棕色Caput Mortuum紫色地球红色黄色赭石钛白色镉黄色轻镉黄色深

Cloths [Tab]衬衫T恤Pent Jeans Tee Cargo

好吧,我有很多类别。我在这里有几个问题

  1. 我使用正确的数据进行培训吗?如果没有那么我应该使用什么?
  2. 一旦我训练和测试我的模型,下一步是什么?我该如何使用输出?
  3. 请帮我解决这个问题

    谢谢,

    的NiMesh

1 个答案:

答案 0 :(得分:1)

是的,一旦你得到一些输出,你可以用它来测试。 你可以看到一些测试数据集产生一些测试结果。 有些是好的,但有些则不是。 调整模型或测试数据集可能是您的下一步。