标签: algorithm analytics apache-spark web-analytics
我在文本文件中存储了一系列以JSON格式存储的事件。这些事件代表用户在网站上执行的操作 - 页面查看,项目点击,自动完成等。我想要做的是通过我的网站找到共同的旅程 - 例如"行为流程"谷歌分析中的标签:
我想知道是否有任何标准工具或算法或技术可用于生成此功能。我目前正在使用Apache Spark,所以我更倾向于使用与之兼容的解决方案。
我可以轻松地自己构建,但我的目的是了解常见的最佳实践(如果有的话)。