用于Web应用程序的实时预测建模工具

时间:2012-05-11 04:54:34

标签: algorithm prediction

我有一个购物网站。我想构建一个简单的预测模型,以预测用户在一次访问(每页上花费的时间,她来自哪里,有多少评论等等)的时间内购买某种产品的可能性,何时可能留下一页等。

Ruby on Rails,Python或Java中可用于此任务的工具有哪些?典型的统计建模技术,如逻辑回归,线性回归在这种情况下是否有效?

谢谢。

1 个答案:

答案 0 :(得分:4)

我尝试将问题减少到分类问题 - 并使用Machine learning现有工具来获得答案。

以下是您需要采取的一些步骤:

  1. 使用您的数据和提取定义的功能。例如,一个功能可能是:访问过的页面数或在网站上花费的时间,或者您可以从数据中提取的任何其他内容。
  2. 定义您要“预测”的功能(分类)。一个简单的例子可能是:购买产品(让我们从购买任何产品开始,您可以稍后尝试增强它)。
  3. 创建培训集。训练集包含尽可能多的分类示例。 (例如:用户我访问了5个不同的页面,花了4分钟,已知分类:没有购买产品)。
  4. 鉴于此信息,您可以运行任何现有的分类算法,以尝试预测非分类用户的行为,仅考虑她的功能。
  5. 您可以使用的一些算法的简短列表:

    1. SVM - 不直观 - 但被许多人认为是最好的分类算法。
    2. K Nearest neighbor - 非常直观且易于编程,并且训练集可以轻松地迭代增加,但如果功能的数量很多,通常是一个错误的决定。
    3. Decision trees算法,尤其是C4.5:允许非常快速的分类,并且生成的树直观且易读。
    4. 我不知道Ruby on rails或python工具,但在Java中 - 有一个名为Weka的开源项目,它有这些分类算法等等。

      注意:

      您可以通过在训练集上使用confusion matrix来评估您的算法并获取cross-validation(评估算法的正确程度,错误程度以及错误程度,以及如何)。