无法从Spark Streaming应用程序中的Twitter API获取精确短语

时间:2014-02-19 11:34:05

标签: scala twitter apache-spark

我的经营者,周末愉快。我想要来自Twitter API的确切短语。如果我把它作为“愉快的周末”,它需要包括双引号。但我想要排除双引号和确切的短语,

推文:祝你周末愉快--------->通过申请提取  推特:祝你周末愉快健康--------->不是由应用程序提取

请同样帮助我。

我正在使用scala 2.9.3和spark 0.7.3。

谢谢, Reddi

1 个答案:

答案 0 :(得分:0)

不幸的是,根据documentation,Streaming API上的跟踪端点不支持完全匹配。

  

短语可以是由空格分隔的一个或多个术语,如果短语中的所有术语都出现在推文中,则短语将匹配,无论顺序如何且忽略大小写。

您必须在scala代码中进行一些额外的过滤。