我在cassandra中有一个表,其中有一个类型为'text'的列。 它拥有的值是json类型的数据。
因此,在每个记录中,此列将具有类似的值。
{“a”:“1”,“b”:“5”,“c”:“3”,“d”:“12”}
类似地,在下一个记录中它将具有类似
的值{“a”:“12”,“b”:“52”,“c”:“13”,“d”:“3”,}
所以我可以说这个列在每条记录中都有一个json值。
我的要求是使用spark / sparksql检索每条记录的“b”和“d”的值。
答案 0 :(得分:-1)
在Cassandra表中读取后,您可以在文本列上执行用户定义函数(UDF),在该udf中,您可以将字符串转换为JSON对象并返回所需的字段。