标签: csv pyspark
我有一个.nt格式的文件。每行是一个三元组。例如:
0 <dbo:class> <dbp:aconoidasida> 0 <dbo:class> bla bla
我想将此文件转换为有效的.tsv格式。在pyspark中做到这一点的最佳方法是什么?
我不知道按以下方法拆分每一行是否是一个好主意 模式:“多个空格多个字符>”?`