我应该使用哪种数据挖掘算法来找到最佳性能(在这种情况下)

时间:2015-06-25 09:11:21

标签: algorithm cluster-analysis data-mining

我有一个数据集,其中包含帖子的以下信息time of the dayday of the weekperformance。该帖子是在某个博客上发布的博客文章,使用访问次数,纪念等来计算性能。我们试图找到发布时间,发布日期和性能之间的相关性。我倾向于使用聚类算法,但我不知道如何解决这个问题,你会推荐什么算法?为什么?

1 个答案:

答案 0 :(得分:1)

就诸如选择方法等一般事项提供建议通常并不容易 - 如果没有数据且只涉及原则,则更是如此。

尽管如此,按照通常的说法,似乎你想要一个模型f(time of day, day of the week)来输出对性能的预测。为此,您基本上可以使用任何回归方法来提供测量数据,例如神经网络,内核回归,回归树(CART)等。

此外,为了获得第一个图形解释,您还可以使用直方图选择某个时间窗口(如四分之一小时),并将该属性视为该时间窗口中的平均性能。

如上所述,到目前为止,这些只是一般事情 - 我希望尽管如此。

相关问题