如何通过pyspark将.nt文件转换为tsv文件?

时间:2019-05-30 22:18:18

标签: csv pyspark

我有一个.nt格式的文件。每行是一个三元组。例如:

0 <dbo:class> <dbp:aconoidasida>
0 <dbo:class> bla bla

我想将此文件转换为有效的.tsv格式。在pyspark中做到这一点的最佳方法是什么?

我不知道按以下方法拆分每一行是否是一个好主意 模式:“多个空格多个字符>”?`

0 个答案:

没有答案