用R刮擦“ aspx”页面

时间:2018-10-17 13:23:20

标签: r web-scraping rvest httr

有人可以帮我还是给我一些建议,如何从以下网址中抓取表格:https://www.promet.si/portal/sl/stevci-prometa.aspx

我尝试使用说明和软件包rvesthttr and html,但对于该特定站点没有任何成功。谢谢。

2 个答案:

答案 0 :(得分:1)

这应该可以帮助您入门:

{'class': 'pipesteps.validate.Validate', 'conf': {'schema_def': {'fields': [{'data_type': 'STRING', 'name': 'Operation'}, {'data_type': 'STRING', 'name': 'SNL_Institution_Key'}, {'data_type': 'INTEGER', 'name': 'SNL_Funding_Key'}, {'data_type': 'STRING', 'name': 'CUSIP'}, {'data_type': 'STRING', 'name': 'SEDOL_NULL'}, {'data_type': 'STRING', 'name': 'Ticker'}, {'data_type': 'DATETIME', 'name': 'Date_of_Closing_Price'}, {'data_type': 'FLOAT', 'name': 'Total_Return_MTD'}, {'data_type': 'FLOAT', 'name': 'TR_SNL_Peer_Index_Change'}, {'data_type': 'FLOAT', 'name': 'TR_SNL_Broad_Index_Change'}, {'data_type': 'FLOAT', 'name': 'TR_SandP_500'}, {'data_type': 'DATETIME', 'name': 'Beginning_Pricing_Date'}]}}, 'id': 'validate'}

答案 1 :(得分:0)

网站使用权的翻译“使用权:www.promet.si网站上包含的所有信息和图像均受到版权保护和其他形式的知识产权保护。在这些网页上发布的文档可能仅出于非商业目的进行复制,并且还必须保留所有版权或其他权利的警告。每次复制时,都应将“国道交通信息中心”列为来源。

我不确定这是否意味着允许用于非商业目的的刮擦。

无论如何,感谢您的警告@s_t以及特别的答案,带有漂亮的代码@hrbrmstr。

相关问题