我目前正在开发AIR应用程序,并且我试图从网站获取某个文本块,其中该文本块始终位于两个特定字符串之间,这些字符串包含从一个页面到另一个页面的链接。 / p>
它看起来像这样:
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>
.
.
_desired content_
.
.
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>
*两个字符串相同
现在,我尝试了几个RegEx表达式但没有成功。我一般都无法理解Regex ...
我尝试的最后一个表达是:/(?<=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)(.*)(?=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)/gsi
但那个人甚至不被认可为RegEx。
我真的很感激这个主题的任何帮助。
提前致谢!
编辑:
感谢 Organis 的帮助,我设法解决了这个问题,确实更容易,更好,不使用RegEx。 这就是我最终做的事情:
text=text.split("Next Chapter<\/span><\/a><\/p>")[1].split("Previous Chapter<\/a>")[0];
text=text.substring(0,text.lastIndexOf("<p><a href"));
答案 0 :(得分:1)
请勿使用 RegEx 。阅读原因:https://blog.codinghorror.com/parsing-html-the-cthulhu-way/。
在两个固定的<span style="float: right">Next Chapter</span></a></p>
之间提取文字,然后关闭最终版<p><a href="**changes**">Previous Chapter</a> <a href="**changes**">
。