使用twitter4j在给定位置附近获取所有推文

时间:2016-03-01 16:07:40

标签: java twitter twitter4j

我想使用Twitter4j从twitter API获取所有推文。这是我使用geoCode获取推文的代码,但我无法获取所有推文,它只是向我显示了大约100条推文。有什么方法可以把它们全部拿走。我认为我可以收到的推文数量有限制,但我不确定。 有人可以帮忙吗?

import java.util.List;

import twitter4j.*;
import twitter4j.auth.AccessToken;

public class Main {
public static void main(String[] args) {

    final Twitter twitter = new TwitterFactory().getInstance();
    final  AccessToken accessToken = new AccessToken("XXX", "YYY");
    twitter.setOAuthConsumer("AAA", "BBB");
    twitter.setOAuthAccessToken(accessToken);

    try {
        Query query = new Query();
        query.geoCode(new GeoLocation(37.781157,-122.398720),1000.0,"mi");
        QueryResult result;
        System.out.println("Searching...");
        int Count=0;

        do {
            result = twitter.search(query);
            List<Status> tweets = result.getTweets();
            for (Status tweet : tweets) {
                if(tweet.getGeoLocation()!=null)
                    System.out.println(tweet.getGeoLocation());
            }
            try {
                Thread.sleep(500);
            } catch (InterruptedException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
        }
        while ((query = result.nextQuery()) != null);
        System.out.println(Count);
        System.exit(0);
    } catch (TwitterException te) {
        te.printStackTrace();
        System.out.println("Failed to search tweets: " + te.getMessage());
        System.exit(-1);
    }
}

}

1 个答案:

答案 0 :(得分:1)

您在如何使用解决方案时遇到一些问题。

您的代码很好
你要求Twitter在最近几天在给定的位置收到一些推文,这就是Twitter给你的东西(目前大约有400条推文),所以...为什么推文这么少?为什么其他网站有so many tweets?主要问题是搜索api
搜索Api
你需要知道search API is focused on relevance and not completeness,所以你只能从最后几天(大约一周)得到一些推文,并且正如文档所述:

  

如果要匹配完整性,则应考虑使用Streaming API

这引导我们迈向下一步......

Streaming Api
在流式api中,您无法搜索推文,您可以实时获取这些推文。如果你想要一个月的本地化推文,你需要在流式api上设置界限并让它运行一个月。在Twitter4j上,您需要设置本地化过滤器,然后运行流式传输,如下所示:

    ConfigurationBuilder cb = new ConfigurationBuilder();
    cb.setDebugEnabled(true).setOAuthConsumerKey("---")
            .setOAuthConsumerSecret("---")
            .setOAuthAccessToken("---")
            .setOAuthAccessTokenSecret("---");

    TwitterStream twitterStream = new TwitterStreamFactory(cb.build())
            .getInstance();
    StatusListener listener = new StatusListener() {

        @Override
        public void onStatus(Status status) {
                //here you do whatever you want with the tweet
            System.out.println(status.getText());

        }

        @Override
        public void onException(Exception ex) {
            ex.printStackTrace();
        }

        @Override
        public void onDeletionNotice(StatusDeletionNotice arg0) {
                  // TODO Auto-generated method stub

        }

        @Override
        public void onScrubGeo(long arg0, long arg1) {

        }

        @Override
        public void onStallWarning(StallWarning arg0) {
            // TODO Auto-generated method stub
            System.out.println(arg0);
        }

        @Override
        public void onTrackLimitationNotice(int arg0) {
            // TODO Auto-generated method stub
            System.out.println(arg0);
        }

    };

    twitterStream.addListener(listener);
    FilterQuery filterQuery = new FilterQuery();
    double[][] locations = {{-74,40}, {-73,41}}; //those are the boundary from New York City
    filterQuery.locations(locations);
    twitterStream.filter(filterQuery);
    twitterStream.filter(filterQuery);

如果您收到太多推文,Streaming Api会剪切它们,所以尽量不要将边界框设置为大。
但是......如果我想要过去的推文而我现在想要它们呢?
这是Twitter获得额外收入的地方,你可以通过Gnip

获得