推荐算法的数据集大小

时间:2014-11-17 05:13:59

标签: dataset weka recommendation-engine

我正在使用 weka 创建推荐系统。到目前为止,我在网上读到的关于数据集的内容是 它应该有更多的数据,以便推荐。 我想知道如果我想推荐一些我们无法获得大量数据的内容。 例如,如果要为特定城市创建公园或医院推荐系统。它不会有超过100个条目。那么可以用小数据集吗?

1 个答案:

答案 0 :(得分:1)

正如this post中所述,有一些指南或经验法则可用于为模型准备足够的数据。这里的一些建议包括:

  • 至少是培训案例数量的六倍
  • 每个班级的功能数量至少三倍

请注意,这些只是经验法则,根据数据的复杂程度,可能会也可能不够。根据本文中提出的建议,100个案例可能就足够了,但正如Ramanan R所说,更多案例可能会更好。

希望这有帮助!