我有如下数据,以便做一个预测性学习,了解人们在网上购买服装时在模特中发现哪些特征有吸引力。
所以我的数据如下。
COLORofCLOTHING MODELHAIR_COLOR MODEL_BUILD SELLER_CATEGORY
Red Black Lean 1
Blue Brown Lean 5
Black Blonde Healthy 10
为了预测服装在给定一组属性的情况下是否能够畅销。 但是,卖家类别可以是1到10之间的任何值(1表示最佳,10表示最差)我不确定如何处理此问题。我正在为此目的使用weka。人们能否就如何解决这个问题向我提出想法?
基本上我想建立一个模型来学习服装颜色等功能,并可以预测衣服的销售情况。
答案 0 :(得分:2)
将数据集转换并标准化为以下内容:
color_red color_blue color_black hair_black hair_brown hair_blonde ... prediction
1 0 0 1 0 0 ... 0
0 1 0 0 1 0 ... 0.5
0 0 1 0 0 1 ... 1
随机森林和神经网络应该能够为您提供预测。