col col2 MaxCount

Question

我有一个数据集

col col2 MaxCount

adf def 5

需要输出为：

col1 col2 EntryNumber

adf def 1

adf def 2

adf def 3

adf def 4

adf def 5

是否可以使用hive Context。请帮助我

Answer 1

val input = sc.textFile("filePath")
val result = input.mapPartitions(x => {
  x.flatMap(y => {
    val line = y.split(delimiter)
    val attribute = line(2)
    (i until attribute.toInt).map(i => {
      y+delimiter+i.toString
    })
  })
})
result.foreach(println)

如何根据scala中数据集中的值复制数据？

col col2 MaxCount

col1 col2 EntryNumber

1 个答案: