从具有多个值的列返回唯一命中

时间:2017-01-25 17:37:56

标签: python bash

我有一个像这样的独特平面文件。 ID和名称由制表符分隔,以下第二个字段具有多个逗号分隔值:

ID1 \t name1,name2,name3
ID2 \t name1,name1,name1,name4
ID3 \t name1,name2,name2,name3

我正在寻找一种方法来修剪第二个字段,以便每行只出现一次。像这样:

ID1 \t name1,name2,name3
ID2 \t name1,name4
ID3 \t name1,name2,name3

1 个答案:

答案 0 :(得分:2)

获得第二个字段后,请使用let csvStrings = dataString.components(separatedBy: ";") // this can also be... let moreGenericCSVStrings = dataString.components(separatedBy: [",", ";"]) // to handle comma separated CSV

set()

返回:

set(["name1","name1","name1","name4"])