我正在尝试使用Java在MongoDB中保存推文,这就是我所拥有的;
JavaStreamingContext ssc = new JavaStreamingContext(sc, new Duration(
3000));
JavaDStream<Status> tweets = TwitterUtils.createStream(ssc);
JavaDStream<String> statuses = tweets
.map(new Function<Status, String>() {
public String call(Status status) {
return status.getUser().getName() + ":"
+ status.getText();
}
});
JavaDStream<String> users = tweets.map(new Function<Status, String>() {
public String call(Status status) {
return status.getUser().getName();
}
});
users.foreachRDD(new Function<JavaRDD<String>, Void>() {
public Void call(JavaRDD<String> rdd) throws Exception {
if (rdd.count() > 0)
rdd.saveAsTextFile("storage/users/test" + rdd.id()
+ "_.txt");
return null;
}
});
就像你看到我可以使用rdd.saveAsTextFile将用户存储在文本文件中,但我需要的是将这个rdd保存到数据库(MongoDB)的方法。
答案 0 :(得分:1)
您可以使用MongoDB Hadoop Connector存储使用com.mongodb.hadoop.MongoOutputFormat
将RDD保存到MongoDB:
Configuration config = new Configuration();
config.set("mongo.output.format", "com.mongodb.hadoop.MongoOutputFormat");
config.set("mongo.output.uri", "mongodb://host:port/database.collection");
rdd.saveAsNewAPIHadoopFile("file://this-is-not-used",
<keyClass>,
<valueClass>,
MongoOutputFormat.class,
config);
查看an example project如何执行此操作可能也会有所帮助。