如何使用nltk - 正则表达式从twitter获取流数据

时间:2011-07-28 01:45:02

标签: python json stream twitter nltk

我是Python的新手,并且我的老板要完成这项任务:

  1. 从JSON
  2. 中获取来自Twitter的流媒体数据
  3. 使用NLTK和正则表达式进行解析
  4. 将其保存到文件库或数据库文件,确定
  5. 有没有人知道如何使用上面的步骤从Twitter获取流媒体数据?

    你的帮助将非常感激:)

3 个答案:

答案 0 :(得分:2)

快速Google搜索会产生Tweepy,这是一个用于访问Twitter API的python库。这应该让你开始。在解析数据方面,您需要更具体地了解要解析的内容。

答案 1 :(得分:1)

这应该指向正确的方向

import urllib2, simplejson

json = urllib2.urlopen('http://search.twitter.com/search.json?q=from%3Aalexiskold').read()
tweets = simplejson.loads(json)["results"]
for tweet in tweets: print tweet["text"]

它不会eval所以我使用simplejson http://simplejson.github.com/simplejson/

答案 2 :(得分:0)

你发了两次相同的问题,显然是:我在另一篇文章中回答。 How to grab streaming data from twitter connect with pycurl using nltk - regular expression