使用SED或AWK使用分隔符分隔.csv列数据

时间:2017-10-16 21:01:00

标签: csv awk sed delimiter

我正在使用包含七列的大型数据。

第2-7列包含前面带有列标题名称+“=”的数据。例如,第2列包含以下数据:

Row 1: Date=2017-08-19
Row 2: Date=2017-08-19
Row 3: Date=2017-08-19
Row 4: Date=2017-08-19

例如,第3列包含以下数据:

Row 1: Campaign=123456789
Row 2: Campaign=123456789
Row 3: Campaign=123456789
Row 4: Campaign=123456789

我需要删除前置数据(所有数据都使用字符串+“=”格式),以便每个单元格只包含实际数据。如何使用SED或AWK执行此操作,最重要的是如何将该数据导出到包含裸数据的新文件(非前置数据)?谢谢。

11111111-1111-1111-111111111111 Date=2017-08-18 00:10:26.39242  Campaign_ID=123456789   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-18 00:27:38.416628 Campaign_ID=123456790   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-28 07:35:48.400623 Campaign_ID=123456791   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-14 09:34:12.602475 Campaign_ID=123456792   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-21 13:27:01.466864 Campaign_ID=123456793   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-12 16:42:07.427034 Campaign_ID=123456794   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-19 20:31:09.754326 Campaign_ID=123456795   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-30 14:32:28.054    Campaign_ID=123456796   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-09 12:08:31.876589 Campaign_ID=123456797   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD
11111111-1111-1111-111111111111 Date=2017-08-21 22:03:17.1221   Campaign_ID=123456798   placement_name=HELLO    event_type=Impressions  pcp=NA  package_name=WORLD

1 个答案:

答案 0 :(得分:2)

sed 解决方案:

main.r