给出以下HTML代码段:
<span itemprop="streetAddress">59 Court St.<br>City Hall</span>
我想提取包含span
标记的<br>
的内容。我可以使用以下内容提取文本:
process 'span[itemprop="streetAddress"]', address => 'TEXT';
但这会遗漏<br>
标记。
答案 0 :(得分:2)
好的,我破解了源代码Web::Scraper
,看到你可以将第二个参数的值设置为&#39; RAW&#39;像这样:
process 'span[itemprop="streetAddress"]', address => 'RAW';