Question

我不了解如何从文档中访问HTML表格。

我正在玩这个链接： Scotia Bank Jobs

想法是点击＆＃34;下一页＆＃34;按钮多次，并将所有小型HTML表格合并为一个。

当我用WWW::Mechanize::Firefox打开链接时，我可以使用

获取整个文档（和第一页HTML表格）

 my $cont= $mech->content( format => 'html' );

之后我点击＆＃34;下一页＆＃34;按钮

my $id="search_result_next_page_link"; 
$mech->click({ xpath => qq{//*[\@id="$id"]}, synchronize => 0 });

我可以多次单击该按钮并在文档中更改表格，但我不能再使用$mech->content，因为URL相同且内容不会更改。

我正在尝试类似的事情：

my $tt= $mech->xpath('/html/body/form/div[4]/div/main/div/div[3]/section/div/div/table/text()');
print $tt;

但它会打印＆＃34; 0＆＃34;。

我有一种感觉，我非常接近，任何想法如何在每次点击后获取HTML表格????

Answer 1

最后......我不得不打扰WWW::Mechanize::Firefox模块的作者，他提供了解决方案如何获取此表的HTML代码。脚本应该是这样的：

@tt= $mech->selector('.tableSearchResults'); $HTMLtable= $tt[0]->{innerHTML};

别忘了，你需要在每次点击后等待（或者创建一个循环，等待元素出现）。