我想从csv文件的第二列中提取值,并将提取的值存储在新列中。
我的数据集样本:
page_name post_id page_id
A 86680728811_272953252761568 86680728811
A 86680728811_273859942672742 86680728811
B 86680728033_281125741936891 86680728033
B 86680728033_10150500662053812 86680728033
我想提取下划线后的数字并将其存储在新列中。样本输出:
page_name post_id page_id
A 272953252761568 86680728811
A 273859942672742 86680728811
B 281125741936891 86680728033
B 10150500662053812 86680728033
我尝试使用此代码:
cat FB_Dataset.csv | sed -Ee 's/(.*)post_id/\1post_id/' -e 's/,[_ ]/,/' -e 's/_/,/'
但是我没有得到想要的输出。
感谢您的帮助。谢谢。
答案 0 :(得分:0)
sed 's/[0-9][0-9]*_//' < a.csv
其中a.csv是包含原始数据的文件
编辑以添加[0-9]