Twitter Streaming Spark:流媒体上下文可以拥有多少个过滤关键字?

时间:2016-03-07 05:04:59

标签: twitter apache-spark spark-streaming

我正在使用spark流式上下文来使用scala中的api来传输Twitter数据。   https://spark.apache.org/docs/1.0.0/api/java/org/apache/spark/streaming/twitter/TwitterUtils.html

我想知道可以为创建流媒体功能提供多少过滤关键字? (以下功能的第3个参数)

TwitterUtils.createStream(ssc,None,keywords)

twitter API可以处理多少个过滤器关键字。

2 个答案:

答案 0 :(得分:1)

根据this question,似乎twitter不会根据您提供的过滤器的数量限制您,而是限制您允许使用的总体积。似乎限制是推文总数的%1。

答案 1 :(得分:0)

您可以输入一组关键字作为过滤器来跟踪Twitter,根据当前限制,您最多可以跟踪400个关键字。