如何删除csv中的unicode标签?

时间:2016-11-30 16:16:52

标签: python regex csv unicode sed

我有一个看起来像这样的csv:

"[u'Title, Volume.']",[u'19780620']
[u'Title 2.'],[u'19910607']
"[u'Catalogue.']",[u'19910429']

我想要一个看起来像这样的csv:

'Title, Volume.','19786020'
'Title 2.','199110607'
'Catalogue.','19910429'

我更喜欢通过带有sed + regex的Mac终端这样做,但我想我也可以使用python。我尝试了各种各样的正则表达式,这最接近解决至少一开始的字符问题:

sed 's/[\"\[u]//g' file.csv

但它删除所有' u'字符 - 不仅仅是开头的字符。如何编写一个能达到我想要的结果的正则表达式?

1 个答案:

答案 0 :(得分:2)

我最终运行了三个单独的sed命令,因为我不确定如何将它们串在一起,但最终到达那里。

sed -ie 's/"//g' file.csv
sed -ie 's/\[[u]//g' file.csv
sed -ie 's/\]//g' file.csv

欢迎任何更优雅的解决方案!