Cassandra Spark读取性能 - 双值问题

时间:2017-03-31 10:47:23

标签: apache-spark spark-cassandra-connector

我的列系列包含5M行(133GB)的所有字符串列。

My Spark程序从此键空间读取数据,打印计数在80秒内完成。

但是,如果我用 double 列替换一个字符串列,则相同的Spark程序需要超过300秒。

我想知道为什么会这样。 是因为任何解析发生在后台吗?

0 个答案:

没有答案