推荐系统需要多少数据?

时间:2013-08-12 23:18:21

标签: dataset decision-tree recommendation-engine expert-system neural-network

我必须为人力资源部门开发个性/工作适合性在线测试。基本上,用户将回答问题,例如0-10,在说出50个问题之后,我想将其转换为5个不同的个性/工作适合性特征的评级。

我没有任何真正的数据,所以首先,使用像MyMediaLite(github)这样的推荐引擎是值得的。我需要多少样品来训练它才能获得不错的表现?

我之前建立了一个培训课程推荐人,通过简单地做和手工加权的总和,每个问题增加了与该问题相关的几门课程的权重。它是一个专家系统,像前馈神经网络一样构建,我个人根据我对问题和课程内容的了解来调整所有权重。

我想这次使用推荐系统,但我想知道有多少次我需要进行50次问题测试,然后手动分配结果。会有100个例子吗?这可能是可能的。 1000会太长。我怎么能提前知道?

1 个答案:

答案 0 :(得分:1)

虽然没用,但我想说这不可能给出一定的数字。添加新样本时,您应该专注于学习曲线。

您可以手动和引擎平行处理样品,并比较两者给出的结果。一旦测量,例如回忆和发动机给出的结果的精度达到了你的期望,然后你得到足够的样品。

希望这有用!