标签: apache-spark spark-cassandra-connector
我的列系列包含5M行(133GB)的所有字符串列。
My Spark程序从此键空间读取数据,打印计数在80秒内完成。
但是,如果我用 double 列替换一个字符串列,则相同的Spark程序需要超过300秒。
我想知道为什么会这样。 是因为任何解析发生在后台吗?