R readLines()忽略后跟#的url标记

时间:2017-08-16 21:19:14

标签: r web-scraping

我用的时候     readlines方法(" https://www.ncbi.nlm.nih.gov/gene/?term=AGAP8#see-all&#34) 我得到一个相同的向量     readlines方法(" https://www.ncbi.nlm.nih.gov/gene/?term=AGAP8&#34) 这与我在浏览器中访问URL时获得的页面完全不同。有没有办法从页面中检索带有#see-all?

的额外数据的HTML

页面的#see-all版本强制它成为搜索结果页面(在浏览器中),而不是“有用”#39; (恼人的)重定向到错误的页面。

0 个答案:

没有答案