使用Tweepy过滤基于语言的推文

时间:2012-10-14 23:41:56

标签: python twitter tweepy

我正在使用tweepy来传输和捕获有关项目名人的推文,并意识到有一半数据不是英文版(我现在需要用英文进行分析)。那么有没有一种方法可以根据推文的语言过滤流媒体,或者以某种方式过滤类似的过滤器?

1 个答案:

答案 0 :(得分:0)

不幸的是,流数据不包含ISO语言代码,因此我认为唯一的方法是直接检测语言(this answer可能有帮助)。根据您传输的数据量,您可能需要先存储数据,然后再进行第二个过程来检测语言并丢弃所有不需要的数据。