我正在尝试收集推文并提取项目的文本部分。我尝试了很多方法,其中大多数对我来说都很好。虽然我偶然发现了这个nltk.twitter包和一些代码片段来做同样的工作。代码很干净,我想用它。但是即使是最简单的代码也会给我401错误,虽然我在twitter开发者处拥有自己的帐户并且需要所有四个密钥。
from nltk.twitter import Twitter
tw = Twitter()
tw.tweets(keywords='love, hate', limit=10)
我从http://www.nltk.org/howto/twitter.html#simple获取了这个例子并尝试了给出的每个例子。它们都不起作用。显然我找不到原因。感谢您的帮助。
答案 0 :(得分:1)
可能有一些原因造成了这种情况。但是我打赌这是时间问题,因为nltk试图使用流光,而你的计算机/服务器的时间不同步。
还要确保完全安装nltk。尝试
import nltk
dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")
dl.download()
答案 1 :(得分:0)
使用nltk.twitter需要在TWITTER环境变量中使用credentials.txt文件路径,并且必须正确输入文本文件中的数据。
例如:
`app_key =你的消费者密钥
app_secret =您的消费者秘密
oauth_token =您的访问权限
oauth_token_secret =您的访问权限秘密 `
'='之后应该没有空格。另外,请勿将密钥放在“YOUR CONSUMER KEY”之类的引号中。
这解决了我的问题。