应用错误收集

如何通过pyspark将.nt文件转换为tsv文件？

时间：2019-05-30 22:18:18

标签： csv pyspark

我有一个.nt格式的文件。每行是一个三元组。例如：

0 <dbo:class> <dbp:aconoidasida>
0 <dbo:class> bla bla

我想将此文件转换为有效的.tsv格式。在pyspark中做到这一点的最佳方法是什么？

我不知道按以下方法拆分每一行是否是一个好主意模式：“多个空格多个字符>”？`

0 个答案:

没有答案