如何使用R中的readHTMLTable读取已注释掉的HTML表

时间:2016-09-09 21:59:33

标签: html r html-parsing

在过去,我已经能够在R中使用readHTMLTable来获取一些足球统计数据。当今年再次尝试这样做时,表格没有显示,即使它们在网页上可见。以下是一个示例:http://www.pro-football-reference.com/boxscores/201609080den.htm

当我查看页面的来源时,表格都被注释掉了(我怀疑是为什么readHTMLTable没有找到它们。)

示例:在源代码中搜索“team_stats”...

    <!--  
    <div class="table_outer_container">
    <div class="overthrow table_container" id="div_team_stats">
    <table class="stats_table" id="team_stats" data-cols-to-  freeze=1><caption>Team Stats Table</caption>

问题:

如何在源中注释掉表格,并在浏览器中显示?

有没有办法使用readHTMLTable(或其他方法)读取已注释掉的表?

1 个答案:

答案 0 :(得分:6)

实际上,如果您使用XPath 3.x选择器,您可以抓住它:

comment()