notepad ++复杂的正则表达式

时间:2017-12-02 19:16:42

标签: html regex notepad++

我有一个庞大的HTML文件,我想删除所有以[sound:开头并以<div style='font-family: Arial; font-size: 15px;'></div>

结尾的部分

以下是我的文档示例:

<div class=Answer>
        <div style='font-family: Arial; font-size: 50px;'>你好</div>
        <br />nĭ hăo<br />[sound:pronunciation_zh_你好.mp3]
        <a href='javascript:py.link("ankiplaypronunciation_zh_你好.mp3");' title="pronunciation_zh_你好.mp3" class="replaybutton browserhide">
           <span>
              <svg viewBox="0 0 32 32">
                 <polygon points="11,25 25,16 11,7"/>
                 Replay
              </svg>
           </span>
        </a>
        <span style="display: none;">&#91;sound:pronunciation_zh_你好.mp3&#93;</span><br />
        <div style='color: DarkSlateGray; font-size: 25px;' ></div>
        <br />
        <div style='font-family: Arial; font-size: 15px;'></div>
     </div>

预期结果:

<div class=Answer>
        <div style='font-family: Arial; font-size: 50px;'>你好</div>
        <br />nĭ hăo<br />
     </div>

我尝试在Notepad ++中使用正则表达式,但我无法弄清楚这一点,特别是因为我总是得到&#34;无效的表达式&#34;可能是由于</>个字符。

提前感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

搜索此表达式并将其替换为空:

\[sound:.*?<div\s+style='font-family:\s+Arial;\s+font-size:\s+15px;'></div>