我对Kudu有嵌套字段的问题。
我有来自Kafka的JSON:
{
"ts": 32,
"status": "success",
"uid": "3232",
"url": "http://some_url",
"syncpixel": "http://some_url",
"dfp": {
"DFP_UABrowser": "Chrome 61",
"DFP_UAOperatingSystem": "Windows 7 ver.7.0",
"JavascriptDisplayData_Screen_W_x_H": "1440 x 900",
"Native_client": true
}
}
dfp
字段有一个嵌套对象,我想通过Flume将此对象插入kudu
我知道kudu不支持嵌套字段,并且支持二进制列。 我需要做什么?
dfp
转换为二进制格式并阅读例如scala spark?答案 0 :(得分:0)
如果您使用Spark / Scala,则在具有正确的设置群集时将不会出现流传输并出现问题。 通过spark阅读整个json并使用“爆炸”功能展平json。 这将使生活更轻松。