需要帮助来处理非结构化文本文件数据

时间:2019-08-20 07:05:54

标签: scala apache-spark rdd

我有RDD [String]数据,看起来如下:

          T key:   STATE:A     Company:x                                                      
                   Line :90    SUBLINE:90
                   Type:A      ver:1.0

预期如下数据

T键:STATE:A C0mpany:x Line:90 SUBline:90 Type:A版本:1.0

基本上想合并T键的数据并为结构类型的T键创建列。

您能帮忙吗?

0 个答案:

没有答案