如何使用scala或python将结构化数据映射到schemaRDD?

时间:2015-02-20 22:13:20

标签: python scala apache-spark

我有一个想要映射到schemaRDD的结构化数据。数据如下所示:

{recordType:NEW,data:{keycol:val1,col2:val2,col3:val3,col4:val4}
{recordType:update,data:{keycol:val1,col2:val5,col3:val6,col4:val7}

我希望能够在将它映射到schemaRDD之后运行sql,如下所示:

select keycol, col1, col2 from tableT1 where col3 = val3

感谢任何帮助。

0 个答案:

没有答案