预测新闻文章的点击率

时间:2014-06-09 08:31:55

标签: machine-learning nlp

我是机器学习的新手。目前,我收到的任务是根据新闻文章点击率的历史来预测新闻报道的点击率。

我尝试使用新闻文章标题的关键词作为预测特征,使用线性回归模型来预测新闻文章的点击率。但是高维度诅咒的b / c,线性模型适合训练日期好吧,但是对测试数据的预测非常糟糕。

我似乎无法通过使用线性建模解决问题。有人可以解释我吗?

1 个答案:

答案 0 :(得分:0)

应用特征缩放可以解决您的问题。 对于应用特征缩放,您需要将每个属性的每个值除以该列(属性)的特定值。该值可能是:

  1. 最大值
  2. 平均值
  3. 通过应用特征缩放,在-3到+3的范围内减少属性的每个值。

    我建议您必须将每个值除以该参数的平均值。

    为了获得更好的结果,您也可以应用参数的正则化。