spark数据帧java爆炸功能

时间:2016-05-24 06:07:32

标签: java apache-spark dataframe

我有以下json文件

{
   "data": [
      {
         "id": "254094394708288_946242468826807",
         "from": {
            "name": "Emirates NBD  \u0628\u0646\u0643 \u0627\u0644\u0625\u0645\u0627\u0631\u0627\u062a \u062f\u0628\u064a \u0627\u0644\u0648\u0637\u0646\u064a",
            "category": "Bank/Financial Institution",
            "id": "254094394708288"
         }    
      },
      {
         "id": "254094394708288_945515772232810",
         "from": {
            "name": "Emirates NBD  \u0628\u0646\u0643 \u0627\u0644\u0625\u0645\u0627\u0631\u0627\u062a \u062f\u0628\u064a \u0627\u0644\u0648\u0637\u0646\u064a",
            "category": "Bank/Financial Institution",
            "id": "254094394708288"
         }        
      }
]
}

我想基于“data”JSON数组中的JSON对象创建一个hive表。我想用Java做到这一点。我不想做“选择data.id,data.from from temptable”。我想做一些类似于select *查询的事情。它应该自动从json对象推断出模式。我来找python和scala中的爆炸功能。

http://stackoverflow.com/questions/31859271/sparksql-and-explode-on-dataframe-in-java

Java中有类似的东西吗?

1 个答案:

答案 0 :(得分:1)

在Java中,完全相同:

org.apache.spark.sql.functions.explode(Column e)

返回Column

您可以查看我的回答here了解详情