我的目标是收集所有包含" France"和"德国"并且还收集相关联的元数据(例如,附加到推文的地理坐标)。我知道这个元数据是可用的,但我无法弄清楚如何使用Java库来访问它:" twitter4j"。
好的,所以我到目前为止从twitter4j网站上的代码示例中获取。它打印出包含我所选关键字的所有推文,因为它们是由Twitter的Streaming API实时提供的。我在我的TwitterStream对象上调用filter方法,这提供了流。但我需要更多控制权。也就是说,我希望能够:
1)将推文写入文件; 2)只打印前1000条推文; 3)访问附加到推文的其他元数据(过滤方法只打印出用户名和推文本身)。
这是我到目前为止的代码:
import twitter4j.FilterQuery;
import twitter4j.Status;
import twitter4j.StatusDeletionNotice;
import twitter4j.StatusListener;
import twitter4j.TwitterException;
import twitter4j.TwitterStream;
import twitter4j.TwitterStreamFactory;
import twitter4j.conf.ConfigurationBuilder;
public class Stream {
public static void main(String[] args) throws TwitterException {
ConfigurationBuilder cb = new ConfigurationBuilder();
cb.setDebugEnabled(true);
cb.setOAuthConsumerKey("bbb");
cb.setOAuthConsumerSecret("bbb");
cb.setOAuthAccessToken("bbb");
cb.setOAuthAccessTokenSecret("bbb");
TwitterStream twitterStream = new TwitterStreamFactory(cb.build()).getInstance();
StatusListener listener = new StatusListener() {
public void onStatus(Status status) {
System.out.println("@" + status.getUser().getScreenName() + " - " + status.getText());
}
public void onDeletionNotice(StatusDeletionNotice statusDeletionNotice) {
System.out.println("Got a status deletion notice id:" + statusDeletionNotice.getStatusId());
}
public void onTrackLimitationNotice(int numberOfLimitedStatuses) {
System.out.println("Got track limitation notice:" + numberOfLimitedStatuses);
}
public void onScrubGeo(long userId, long upToStatusId) {
System.out.println("Got scrub_geo event userId:" + userId + " upToStatusId:" + upToStatusId);
}
public void onException(Exception ex) {
ex.printStackTrace();
}
};
FilterQuery fq = new FilterQuery();
String keywords[] = {"France", "Germany"};
fq.track(keywords);
twitterStream.addListener(listener);
twitterStream.filter(fq);
}
}
答案 0 :(得分:5)
用新鲜的眼睛看着这个后,我意识到了解决方案(这很明显)。编辑以下代码部分:
public void onStatus(Status status) {
System.out.println("@" + status.getUser().getScreenName() + " - " + status.getText());
}
允许我访问其他元数据。例如,如果我想访问推文的日期,我只需要添加以下内容:
System.out.println(status.getCreatedAt());
答案 1 :(得分:0)
当API试图访问目前无法获取的某些信息时,会出现错误401。因此,您需要检查Twitter上允许的权限。将其更改为READ,WRITE和...以获得完整的API访问权限。或者可能存在问题,因为您可能正在使用代理服务器。因此,请使用以下命令提及代理详细信息。
System.getProperties().put("http.proxyHost", "10.3.100.211");
System.getProperties().put("http.proxyPort", "8080");
答案 2 :(得分:0)
在文件上写推文:
FileWriter file = new FileWriter(....);
public void onStatus(Status status) {
System.out.println("@" + status.getUser().getScreenName() + " - " + status.getText() + " -> "+ status.getCreatedAt());
try {
file.write(status.getUser().getScreenName() + " - " + status.getText() + " -> "+ status.getCreatedAt() +"\n");
file.flush();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}