从头标记中获取Javascript的内容

时间:2014-03-24 04:53:09

标签: xpath

我需要从这个Javascript标记中获取特定内容,该标记位于html doc:

部分
<script type="text/javascript">
    var sbc = "<a href='http://www.test.com/Default.aspx' style='color:#e16a58;'>Home</a> / Men's Bikes";
</script>

即“男士自行车”文字。有谁知道我怎么能这样做?

我试过这个让我得到所有标签:

/html/head/script[@type='text/javascript']

但不确定如何缩小到那一个 - 在。

中有很多标签

1 个答案:

答案 0 :(得分:0)

如果将此xpath应用于输入XML:

/html/head/script[@type='text/javascript']/text()

我们得到了

var sbc = " / Men's Bikes";

使用substring-aftersubstring-before可以进一步操作所需的输出文本。 e.g。

/html/head/script[@type='text/javascript']/substring-after(text()[last()], '/ ')

输出:

Men's Bikes";

最终:

/html/head/script[@type='text/javascript']/substring-before(substring-after(text()[last()], '/ '), '";')

输出

Men's Bikes