我有一个以制表符分隔的文件。从excel导出时,如果单元格中有逗号,则会用双引号说明单元格。
要找到第一个双引号,我可以找一个标签,然后双引号ex:\t"
要删除的下一个双引号是在行的末尾,所以我想找到双引号然后换行符:\n"
但这不起作用。
文件格式示例:
text
TAB text
TAB "moretextwithquotes"
CRLF
答案 0 :(得分:1)
首先,如果我完全理解您的问题,那么您正在搜索\n"
而不是"\n
。
其次,您需要搜索\r\n
而不是\n
,因此您的最终结果应为"\r\n
。
答案 1 :(得分:1)
如果所有数据在双引号匹配并且封装字段的情况下是一致的,则 我只是做一个全局查找并替换引用的文本 仅使用字段数据替换匹配项。这剥离了引号,留下了所有内容 别的没有动过。
查找:"([^"\\]*(?:\\.[^"\\]*)*)"
替换:$1