Question

我正在尝试收集推文并提取项目的文本部分。我尝试了很多方法，其中大多数对我来说都很好。虽然我偶然发现了这个nltk.twitter包和一些代码片段来做同样的工作。代码很干净，我想用它。但是即使是最简单的代码也会给我401错误，虽然我在twitter开发者处拥有自己的帐户并且需要所有四个密钥。

from nltk.twitter import Twitter
tw = Twitter()
tw.tweets(keywords='love, hate', limit=10)

我从http://www.nltk.org/howto/twitter.html#simple获取了这个例子并尝试了给出的每个例子。它们都不起作用。显然我找不到原因。感谢您的帮助。

Answer 1

可能有一些原因造成了这种情况。但是我打赌这是时间问题，因为nltk试图使用流光，而你的计算机/服务器的时间不同步。

还要确保完全安装nltk。尝试

import nltk
dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")
dl.download()

Answer 2

使用nltk.twitter需要在TWITTER环境变量中使用credentials.txt文件路径，并且必须正确输入文本文件中的数据。

例如：
`app_key =你的消费者密钥

app_secret =您的消费者秘密

oauth_token =您的访问权限

oauth_token_secret =您的访问权限秘密 `

'='之后应该没有空格。另外，请勿将密钥放在“YOUR CONSUMER KEY”之类的引号中。

这解决了我的问题。