Question

我正在使用一些正则表达式来识别我经常收到的一些YML文件中的内联标记。

我确实需要使用Regex Expression标识以下类型的标记：

<p class='link-pdf'>
</li>
<a id = 'pdf' href='#' target='_blank' class= 'pdf' onclick='location.href=\"/pdf/help/%{language}/download.pdf\"'>

我试过很多正则表达式......但是没有一个正常工作..

¿有人能帮帮我吗？

Answer 1

好的，根据您的上一条评论。

捕获表单文本的所有标记的正则表达式可能如下所示：

<a[^>]*>(.(?!</a>))*.?</a>

这打破了

如果您希望标签的内部是捕获组，那么

<a[^>]*>((?:.(?!</a>))*.?)</a>

Answer 2

据我了解，您希望匹配<a>标记的内部，无论属性如何混乱：

(<\s*a\s*[^>]*>)([^<]*)(<\s*/\s*a[^>]*>)

Regular expression visualization

第二个捕获组将包含文本。