我有以下流,当我收到推文时,我想找到以下哪个词组和用户,我收到了推文。
stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])
twitter api或tweepy上是否有任何支持。如果不是最好的手工方式是什么?
Here是一个例子,当收到推文时,我想知道这是因为python短语或javascript或ruby甚至是所有这些的组合
答案 0 :(得分:0)
我认为混淆在于实际理解Streaming API。
根据{{1}}等要求打开连接后,Twitter会向您发送符合该条件的所有推文(在指定的限制范围内)。他们不做任何类型的分离,你马上收到所有东西。
你可以做的是对这些单词的每条推文进行过滤(标记化),这可以在你收集所需的推文数量后,或通过某种类型的流媒体实时方法完成。
从您提供的示例中,他对推文进行了后处理,并根据他在收集期间收到的所有数据绘制了提及的频率。
我希望澄清事情。