删除引号前后的所有字符

时间:2015-03-03 16:31:42

标签: csv replace

我有一个CSV文件,它有两列和4500行。在一列中,我有几个用引号括起来的短语。我需要删除引号前后的所有文本。

例如:

How would you say "Hello, my Friend" when speaking outside?
should become "Hello, my Friend"

我还有几行在第二列中有单词NULL。我需要完整删除这些行。

做这样的事情的最佳方法是什么?我一直在研究正则表达式,但我不确定它们是否足够灵活,可以做我想做的事情,或者如何在CSV文件中使用它们(我需要保留表结构)。

编辑: 1)目前我只使用Apple Numbers,但我知道不会这样,所以我很乐意接受任何建议。它必须支持汉字字符。

2)我已经删除了所有的NULL行,因此不再需要(我只是添加了一列数字,对表进行排序,使所有NULL在一起,删除它们并按数字列排序) 。

1 个答案:

答案 0 :(得分:1)

查找支持正则表达式搜索和替换的文本编辑器。

这样的内容与第二列中的,NULL匹配:^.*,NULL.*$。将其替换为" DELETEMEDELETEME"标记该行,或作为空字符串或找到一种方法使其匹配'\ n'或者' \ r'抓住换行符并完全删除整行。

剥离部分引用的字符串可能会这样:

^(.*,){n}(.*)(\".\")(.*)(,.*)$替换为\1\3\5,其中n是您要编辑的列前面的列数。如果没有,请重复(.*,)。这取决于工具的正则表达式风格。