Question

我正在写一个网络刮刀，我是一名Perl新手。我正在使用HTML::TreeBuilder来获取我需要的数据，但我遇到了一个我不确定如何处理的情况。这是一些HTML示例：

<div class="anything" val="20" name="matchup">someUniqueData</div>

我想从此HTML标记中提取val。我一直在使用findvalues()来完成我的大部分工作，但我不知道这是否可以从内部标签中提取数据。我没有成功地掩盖了文档。有这种刮刮的简单解决方案吗？

Answer 1

您需要（使用HTML::TreeBuilder::XPath）：

my ($val) = $tree->findvalues('//div[@class="anything"]/@val');