我正在尝试在文本限定符中排除定界符。为此,我正在尝试使用正则表达式。但是,我是Regex的新手,无法完全满足我的需求。如果有人可以帮助我,我将非常感激。
在Alteryx中,我将带分隔符的纯文本文件加载为“无分隔符”,并说它没有文本限定符。因此,输入将如下所示:
- “ aabb” | ccdd | eeff | ghhh
- “ aa | bb” | ccdd | eeff | gghh
- “ aa | bb” | ccdd |“ ee | ff” | ghhh
- “ aa | bb” |“ cc | dd” |“ ee | ff” |“ gg | hh”
- “ aabb” |“ ccdd” |“ eeff” |“ ghhh”
- “ aabb” |“ ccdd” |“ eeff” |“ gg | hh”
- aabb | ccdd | eeff | ghhh
- “ aa | bb” | ccdd | eeff |“ gg | hh”
- aabb | cc | dd | eeff | ghhh
- aabb |“ cc || dd” | eeff | ghhh
- aabb |“ c | c | dd” | eeff | ghhh
- “ aa || bb” | ccdd | eeff | gghh
- “ a | a | b | b” | ccdd | eeff | ghhh
- “ aabb” | ccdd | eeff |“ g | g | hh”
- “ aabb” | ccdd | eeff |“ gg || hh”
我想排除文本限定符之间的所有定界符。
我试图用Regex替换文本限定符中的分隔符。
到目前为止,我已经为目标尝试了以下正则表达式代码:
(")(.*?[^"])\|+(.*?)(")
并且我使用以下内容进行替换:
$ 1 $ 2 $ 3 $ 4
但是,这不会修复第11、13、14和15行。
我希望获得以下结果:
- “ aabb” | ccdd | eeff | ghhh
- “ aabb” | ccdd | eeff | ghhh
- “ aabb” | ccdd |“ eeff” | ghhh
- “ aabb” |“ ccdd” |“ eeff” |“ ghhh”
- “ aabb” |“ ccdd” |“ eeff” |“ ghhh”
- “ aabb” |“ ccdd” |“ eeff” |“ ghhh”
- aabb | ccdd | eeff | ghhh
- “ aabb” | ccdd | eeff |“ ghhh”
- aabb | cc | dd | eeff | ghhh
- aabb |“ ccdd” | eeff | ghhh
- aabb |“ ccdd” | eeff | ghhh
- “ aabb” | ccdd | eeff | ghhh
- “ aabb” | ccdd | eeff | ghhh
- “ aabb” | ccdd | eeff |“ ghhh”
- “ aabb” | ccdd | eeff |“ ghhh”
预先感谢您对我的帮助!
诚挚的问候,
罗宾