使用Web :: Scraper从元素的内容中提取文本和HTML

时间:2016-02-11 00:48:43

标签: perl web-scraping

给出以下HTML代码段:

<span itemprop="streetAddress">59 Court St.<br>City Hall</span>

我想提取包含span标记的<br>的内容。我可以使用以下内容提取文本:

 process 'span[itemprop="streetAddress"]', address => 'TEXT';

但这会遗漏<br>标记。

1 个答案:

答案 0 :(得分:2)

好的,我破解了源代码Web::Scraper,看到你可以将第二个参数的值设置为&#39; RAW&#39;像这样:

process 'span[itemprop="streetAddress"]', address => 'RAW';