有没有办法将数据查找和规范化例程集成到apache spark处理管道中?

时间:2016-03-13 15:10:03

标签: apache-spark spark-streaming spark-dataframe

作为服务提供商,我们有多个事件/票务系统,我们计划通过Apache Spark来提供数据。其中一个挑战是,这些票务系统中的每一个都采用了自己的语义含义,例如"事件优先级"等等。 这种情况迫使我们通过查找/规范化例程来运行这些事件记录,这些例程将语义调整回一个共同的含义。 我的问题是:是否有可能将此类查找/规范化例程引入Spark流处理管道?

0 个答案:

没有答案