使用LIBSVM来预测用户的真实性

时间:2011-03-10 18:08:18

标签: java machine-learning weka libsvm prediction

我计划使用LibSVM来预测Web应用程序中的用户真实性。 (1)收集有关特定用户行为的数据(例如,登录时间,IP地址,国家等) (2)使用收集的数据训练SVM (3)使用实时数据进行比较,并在真实性水平上生成输出

有人可以告诉我如何用LibSVM做这样的事情? Weka能帮助解决这些类型的问题吗?

1 个答案:

答案 0 :(得分:5)

您提到的三个步骤是解决方案的概述。更详细一点:

  1. 确保您获得大量标记的数据,即使用真实/非真实注释的行为日志。 (如果没有标记数据,您将进入半监督学习的非常先进的领域,或者必须考虑其他解决方案。)
  2. 根据您认为可以很好地预测真实性的数据设计一些功能。尝试使用该方法并对其进行优化,直到它通过某种统计标准运行良好。使用ten-fold cross validation确保您不会过度拟合。
  3. LibSVM可以输出概率估计值及其答案;见其manual
  4. 的第8部分