我已经使用GraphX API和databricks平台构建了一个图,它们表示日志文件的一系列事件。特别是,日志文件的事件的结构如下:
"timestamp event1"
"timestamp event2"
"timestamp event3"
....
因此,节点是具有ID的事件类型(event1,event2,event3, etc...)
,并且边缘表示事件的时间序列,每个边缘的权重例如:
src dest weight
event1 event2 0.7
event1 event4 0.3
event2 event3 0.5
我应该找到从src事件到dest事件的所有可能路径,然后验证以相同方案(such as "timestamp event")
从另一个文件读取的特定事件序列是否对应于找到的可能路径之一。我是Spark和Scala的新手,所以我希望有人可以帮助我做到这一点。