将数据从我的表转换为mahout datamodel

时间:2013-05-30 21:35:56

标签: java mahout recommendation-engine datamodel

我刚刚开始使用mahout,正在考虑从现有数据构建推荐引擎。我当前表中的数据以

之类的格式存储
userId  From      TO        Meal    Carrier            Travel type

MT001   London    Abu Dhabi Non-Veg Lufthansa          International
MT001   Abu Dhabi Beijing   Veg     Lufthansa          International
MT001   New York  Chicago   Non-Veg American Airlines  Domestic
MT002   New York  Texas     Veg     American Airlines  Domestic

现在我想将此数据集转换为mahout接受的数据模型。我知道mahout数据模型的格式就像

  

userId(int),itemId(int),preference value(float)

有人可以建议我如何将我的旅行数据集(包括比mohout数据模型更多的列和不同的数据类型)转换为mahout支持的数据模型。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

我猜你必须重写你的Data模型类,尝试扩展和重写AbstractDataModel类,你也可以尝试使用框架中提供的IDMigrator控件将你的字符串转换为整数值。

完成此主题 - Mahout : To read a custom input file