应用错误收集

R readLines（）忽略后跟＃的url标记

时间：2017-08-16 21:19:14

标签： r web-scraping

我用的时候 readlines方法（＆＃34; https://www.ncbi.nlm.nih.gov/gene/?term=AGAP8#see-all＆＃34）我得到一个相同的向量 readlines方法（＆＃34; https://www.ncbi.nlm.nih.gov/gene/?term=AGAP8＆＃34）这与我在浏览器中访问URL时获得的页面完全不同。有没有办法从页面中检索带有＃see-all？

的额外数据的HTML

页面的＃see-all版本强制它成为搜索结果页面（在浏览器中），而不是“有用”＃39; （恼人的）重定向到错误的页面。

0 个答案:

没有答案