快速正则表达式帮助:从html中获取文本

时间:2012-06-22 19:20:30

标签: regex

我有以下html代码段:

<h1 class="header" itemprop="name">Some text here<span class="nobr">

我想获取html标签之间的文字,我现在几个小时都在挣扎,请帮助我!什么正则表达式可以解决我的问题?

3 个答案:

答案 0 :(得分:0)

你不应该使用正则表达式,而是使用一些HTML解析器。由于您没有指定语言,因此很难提供帮助,但您可以通过Google搜索找到它...


如果您只需要这个案例,则可以使用正则表达式/>(.*?)</

答案 1 :(得分:0)

在Javascript中,您可以通过以下方式访问该信息:

document.getElementsByTagName("h1").item(0).textContent

document.getElementsByClassName("header").item(0).textContent

答案 2 :(得分:0)

像其他人所说的那样 - 你不应该使用正则表达式来解析HTML 。但除此之外,以下内容将为您抓取该文本:

(?<=\>).+(?=\<)