我需要一种方法或算法来根据他的推文预先计算用户的兴趣 ..
用户将他的帐户与他的Twitter帐户相关联,并且在第一次检索他的推文后,我将不得不预先计算他的口味和兴趣。
当这个用户继续使用我的系统时,我必须使这些预测更准确..
是否有一个算法或数学模型可以帮助满足这一要求?
请提供 - 现有的研究链接或开源代码或示例,这将有助于我开始..
答案 0 :(得分:2)
您可以使用Machine-Learning执行此任务。
一种可能的机器学习算法是具有k个最近邻的Bag Of Words:
创建一个training set [您知道他们感兴趣的用户],并使用Bag Of Words [最好用n-grams]来“学习”训练集。
当新用户到达时 - 将单词/ n-gram提取为功能 - 并找到 k nearest neighbors 以确定兴趣所在。
要随着时间的推移获得改进 - 您可以获得一些额外的明确反馈 - 用户可以点击协议/不同意算法所说的内容。您可以稍后使用此信息来扩展训练集的大小 - 这可能会导致更准确的决策。
这是一种用于学习句子/单词集之间“特征”的标准算法,因此您至少应该将其作为指南。
还有一个可能对您有帮助的开源项目:Apache Mahout。