如何格式化spark中没有任何转义字符的数据?

时间:2017-11-23 10:56:26

标签: apache-spark

我有以下选举展位数据的结构,我的任务是计算数据中存在的那些名称,并选择有高投票权的获胜者。

  

展位数据1 -   jojojujujijijajajejejojojujijijajajejejojojujujajajijijeje

     

展位数据2 -   jojojujujijijajajejejojojujijijajajejejojojujujajajijijeje

     

展位数据3 -   jojojujujijijajajejejojojujijijajajejejojojujujajajijijeje

我必须根据上面文件中给出的名字计算投票数,并使用spark找到最大数量。

我可以知道如何格式化数据吗?

0 个答案:

没有答案