在过去,我已经能够在R中使用readHTMLTable来获取一些足球统计数据。当今年再次尝试这样做时,表格没有显示,即使它们在网页上可见。以下是一个示例:http://www.pro-football-reference.com/boxscores/201609080den.htm
当我查看页面的来源时,表格都被注释掉了(我怀疑是为什么readHTMLTable没有找到它们。)
示例:在源代码中搜索“team_stats”...
<!--
<div class="table_outer_container">
<div class="overthrow table_container" id="div_team_stats">
<table class="stats_table" id="team_stats" data-cols-to- freeze=1><caption>Team Stats Table</caption>
问题:
如何在源中注释掉表格,并在浏览器中显示?
有没有办法使用readHTMLTable(或其他方法)读取已注释掉的表?
答案 0 :(得分:6)
实际上,如果您使用XPath 3.x
选择器,您可以抓住它:
comment()