应用错误收集

Cassandra Spark读取性能 - 双值问题

时间：2017-03-31 10:47:23

标签： apache-spark spark-cassandra-connector

我的列系列包含5M行（133GB）的所有字符串列。

My Spark程序从此键空间读取数据，打印计数在80秒内完成。

但是，如果我用 double 列替换一个字符串列，则相同的Spark程序需要超过300秒。

我想知道为什么会这样。是因为任何解析发生在后台吗？

0 个答案:

没有答案