我刚刚开始使用mahout,正在考虑从现有数据构建推荐引擎。我当前表中的数据以
之类的格式存储userId From TO Meal Carrier Travel type
MT001 London Abu Dhabi Non-Veg Lufthansa International
MT001 Abu Dhabi Beijing Veg Lufthansa International
MT001 New York Chicago Non-Veg American Airlines Domestic
MT002 New York Texas Veg American Airlines Domestic
现在我想将此数据集转换为mahout接受的数据模型。我知道mahout数据模型的格式就像
userId(int),itemId(int),preference value(float)
有人可以建议我如何将我的旅行数据集(包括比mohout数据模型更多的列和不同的数据类型)转换为mahout支持的数据模型。任何帮助将不胜感激。
答案 0 :(得分:1)
我猜你必须重写你的Data模型类,尝试扩展和重写AbstractDataModel类,你也可以尝试使用框架中提供的IDMigrator控件将你的字符串转换为整数值。