我不了解如何从文档中访问HTML表格。
我正在玩这个链接: Scotia Bank Jobs
想法是点击"下一页"按钮多次,并将所有小型HTML表格合并为一个。
当我用WWW::Mechanize::Firefox
打开链接时,我可以使用
my $cont= $mech->content( format => 'html' );
之后我点击"下一页"按钮
my $id="search_result_next_page_link";
$mech->click({ xpath => qq{//*[\@id="$id"]}, synchronize => 0 });
我可以多次单击该按钮并在文档中更改表格,但我不能再使用$mech->content
,因为URL相同且内容不会更改。
我正在尝试类似的事情:
my $tt= $mech->xpath('/html/body/form/div[4]/div/main/div/div[3]/section/div/div/table/text()');
print $tt;
但它会打印" 0"。
我有一种感觉,我非常接近,任何想法如何在每次点击后获取HTML表格????
答案 0 :(得分:0)
最后......我不得不打扰WWW::Mechanize::Firefox
模块的作者,他提供了解决方案如何获取此表的HTML代码。脚本应该是这样的:
@tt= $mech->selector('.tableSearchResults');
$HTMLtable= $tt[0]->{innerHTML};
别忘了,你需要在每次点击后等待(或者创建一个循环,等待元素出现)。