我正在使用正则表达式帮助我在我不想翻译的本地化项目中过滤掉HTML。通常我会使用</?\w+((\s+\w+(\s*=\s*(?:".*?"|'.*?'|[^'">\s]+))?)+\s*|\s*)/?>
,但我正在翻译的内容已转义HTML中的字符,例如
<a href\="http\://www.fau.de/studium/zulassung/einschreibung/" target\="_blank" title\="Externer Link auf die Webseite der FAU">
某种灵魂可以帮助我找出如何匹配含有斜线的html标签吗?
答案 0 :(得分:0)
我使用'/&lt;(。| \ n)*?&gt; / g'来匹配我的文本中的所有HTML标记,这对我来说无视这些内容。