使用Storm Trident将行插入cassandra

时间:2014-02-08 20:32:02

标签: java cassandra apache-storm trident

我正在尝试在Cassandra 2.0.5,Storm版本0.9.0.1中向表中插入一个简单的行。

我的测试如下:

我有一个由id(int)和句子(text)列组成的表。 id是主键。

我的spout生成句子,我添加了一个ID(代码中的静态增量)。

这是我的拓扑结构:

TridentTopology topology = new TridentTopology();
StateFactory cassandraStateFactory = CassandraMapState.nonTransactional(options);
Fields fields = new Fields("id", "sentence");
MyTridentTupleMapper tupleMapper = new MyTridentTupleMapper(keyspace, fields);
CassandraUpdater updater = new CassandraUpdater(tupleMapper);
TridentState wordCounts = topology.newStream("spout1", spout)
            .each(new Fields("sentence"), new AddId(), new Fields("id"))
            .partitionPersist(cassandraStateFactory, fields, updater);

LocalCluster cluster = new LocalCluster();
cluster.submitTopology("test", config, topology.build());    

MyTridentTupleMapper的代码:

https://github.com/guywald/trident-cassandra-read-write-examples/blob/master/src/test/java/com/guywald/storm/trident/cassandra/MyTridentTupleMapper.java

我收到以下异常:

2014-02-08 22:20:14 ERROR executor:0 - 
java.lang.RuntimeException: java.lang.ClassCastException: storm.trident.state.map.SnapshottableMap cannot be cast to com.hmsonline.storm.cassandra.trident.CassandraState
    at backtype.storm.utils.DisruptorQueue.consumeBatchToCursor(DisruptorQueue.java:90)
    at backtype.storm.utils.DisruptorQueue.consumeBatchWhenAvailable(DisruptorQueue.java:61)
    at backtype.storm.disruptor$consume_batch_when_available.invoke(disruptor.clj:62)
    at backtype.storm.daemon.executor$fn__3498$fn__3510$fn__3557.invoke(executor.clj:730)
    at backtype.storm.util$async_loop$fn__444.invoke(util.clj:403)
    at clojure.lang.AFn.run(AFn.java:24)
    at java.lang.Thread.run(Thread.java:744)

我不确定为什么它会返回这个并希望得到帮助。

1 个答案:

答案 0 :(得分:0)

看起来CassandraUpdater期望CassandraState,而CassandraMapState.nonTransactional创建不兼容的SnapshottableMap。 我相信常见的(或异国情调的)MapState更新程序将与CassandraMapState一起使用。关于何时在这里使用State vs MapState有一个很好的解释:https://groups.google.com/forum/#!topic/storm-user/TASr2zWyzKs

我认为应该使用CassandraStateFactory作为状态工厂来运行。