使用机器学习技术自动进行日志文件分析,以更好地了解用户行

时间:2015-05-09 17:36:05

标签: machine-learning logfile-analysis

我必须使用机器学习技术自动分析json日志文件,以便更好地理解用户行为并识别经常执行的操作以提高应用程序的可用性。日志文件包含在使用特定应用程序期间记录的文件系统事件,鼠标事件,键盘事件,应用程序事件(启动,终止,活动,停用......)等条目。

Logged条目如下所示:

String regex = "(https?|ftp|file)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]";

我已经进入了机器学习的主题,但我不知道哪个特定技术甚至该领域的子领域可以帮助我解决这个问题。也许某人有一个提示或想法,在哪里可以找到解决方案的正确信息或概念?

1 个答案:

答案 0 :(得分:0)

好的问题对我来说并不完全清楚,但根据我的理解这些是我的意见。

  1. 分类,不确定如何在此处应用。
  2. 集群与上述相同,

  3. 很多概率范围特别是概率图形模型, 如果他在文件系统中打开c://那么歌曲文件夹最有可能是他的下一个文件夹选择可以是Rihanna文件夹或者Emineem,这些东西在一定程度上可以通过图形模型建模。您可以制作自定义模型。这是一个休闲话题,请查看

  4. https://class.coursera.org/pgm/lecture