多功能推荐系统表示

时间:2012-09-10 16:05:08

标签: python numpy scipy data-mining

我正在寻求扩展我的推荐系统以包含其他功能(尺寸)。到目前为止,我正在跟踪用户如何评价某些文档,并使用它来执行建议。我有兴趣添加更多功能,例如用户位置,年龄,性别等。 到目前为止,一些mysql表足以处理这个问题,但我担心随着我添加更多功能,它会很快变得混乱。

我的问题:我怎样才能最好地表达和坚持这种多维数据? Python特定提示会有所帮助。

谢谢

2 个答案:

答案 0 :(得分:0)

SQL数据库在您的情况下应该可以正常工作。实际上,您可以将所有训练示例存储在一个数据库中,每行代表一个特定的训练集,每一列代表一个特征。您可以根据需要添加collumns来添加功能。在关系数据库中,出于各种不一致的原因查询数据时,可能会遇到访问错误。尝试使用NoSQL数据库。我个人在python上使用MongoDB和Pymongo将训练样例存储为JSON格式的dicts。 (以这种方式更容易使用网络应用程序。)

答案 1 :(得分:0)

我建议使用张量,这是多维数组。您可以使用任何数据表或只是文本文件来存储张量。每行或每行都是具有所有列出的不同功能的记录/交易。