我有一个巨大的文本文件,其中包含以下行:
080012;Bovalino;RC;CAL;0964;89034;B098;9021;http://www.website-most.en/000/000/
我想只提取:
080012;***Bovalino***;***RC***;CAL;***0964***;***89034***;B098;9021;http://www.website-most.en/000/000/
并删除所有其他文字。
这可以用正则表达式完成吗?
答案 0 :(得分:0)
您可以捕获要保留的内容并在替换字符串中使用反向引用:
Find what: ^\d*;(\w*;\w*);\w*;(\d*;\d*).*
Replace with: \1;\2
并确保您不勾选. matches newline
选项。
使用Notepad ++ 6,您还可以使用$1;$2
进行替换(含义相同)。
如果不同的字段可能包含各种字符而不仅仅是数字和字母,这可能是您最好的选择:
Find what: ^[^;]*;([^;]*;[^;]*);[^;]*;([^;]*;[^;]*).*