我正在研究一个神经网络项目,该项目读取服务器日志文件并尝试将用户分类为candidate buyers
和random surfers
存储桶。
日志文件类似于
timestamp, user_id, event, page
1454973364, user_A, enter, http://some_url/?page=dashboard
1454973365, user_A, enter, http://some_url/?page=search&q=tablet
1454973366, user_A, enter, http://some_url/?page=faq&item=1234
1454973366, user_B, enter, http://some_url/?page=about_us
1454973366, user_A, enter, http://some_url/?page=order_placed
...
1454973368, user_A, exit, http://some_url/?page=order_placed
1454973368, user_B, exit, http://some_url/?page=about_us
user_A
之类的所有用户都应积极定位为candidate buyers
且user_B
应消极定位并归类为{{ 1}}。当然,我的项目的目标是在用户点击转化页random surfers
之前进行预测。
将此类系列事件建模为输入的最佳方法是什么?
一个更普遍的问题。从日志数据中我们可以获得有关用户如何使用我们网站的信息(拖动小部件,单击链接,向下/向上滚动,在页面上花费的时间等)。给定一系列这样的动作,机器学习中将它们建模为输入的一般方法是什么?