在Bash中的CSV文件中拆分列

时间:2019-09-21 00:39:30

标签: bash csv unix

我想从csv文件的第二列中提取值,并将提取的值存储在新列中。

我的数据集样本:

page_name      post_id                        page_id
A              86680728811_272953252761568    86680728811   
A              86680728811_273859942672742    86680728811
B              86680728033_281125741936891    86680728033
B              86680728033_10150500662053812  86680728033

我想提取下划线后的数字并将其存储在新列中。样本输出:

page_name      post_id                        page_id
A              272953252761568                86680728811   
A              273859942672742                86680728811
B              281125741936891                86680728033
B              10150500662053812              86680728033

我尝试使用此代码:

cat FB_Dataset.csv | sed -Ee 's/(.*)post_id/\1post_id/' -e 's/,[_ ]/,/' -e 's/_/,/'

但是我没有得到想要的输出。

感谢您的帮助。谢谢。

1 个答案:

答案 0 :(得分:0)

sed 's/[0-9][0-9]*_//' < a.csv  

其中a.csv是包含原始数据的文件
编辑以添加[0-9]