Question

我目前正在开发AIR应用程序，并且我试图从网站获取某个文本块，其中该文本块始终位于两个特定字符串之间，这些字符串包含从一个页面到另一个页面的链接。 / p>

它看起来像这样：

<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>
.
.
_desired content_
.
.
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>

*两个字符串相同

现在，我尝试了几个RegEx表达式但没有成功。我一般都无法理解Regex ...

我尝试的最后一个表达是：/(?<=<a href=\".+\">Previous Chapter<\/a> <a href=\".+\">Next Chapter<\/a><\/span><\/p>)(.*)(?=<a href=\".+\">Previous Chapter<\/a> <a href=\".+\">Next Chapter<\/a><\/span><\/p>)/gsi
但那个人甚至不被认可为RegEx。

我真的很感激这个主题的任何帮助。

提前致谢！

编辑：

感谢 Organis 的帮助，我设法解决了这个问题，确实更容易，更好，不使用RegEx。这就是我最终做的事情：

text=text.split("Next Chapter<\/span><\/a><\/p>")[1].split("Previous Chapter<\/a>")[0];
text=text.substring(0,text.lastIndexOf("<p><a href"));

Answer 1

请勿使用 RegEx 。阅读原因：https://blog.codinghorror.com/parsing-html-the-cthulhu-way/。

在两个固定的Next Chapter</a>之间提取文字，然后关闭最终版<a href="**changes**">Previous Chapter</a> <a href="**changes**">。

RegEx匹配稍微改变的两个字符串之间的所有文本

1 个答案: