表格提交上的rvest错误

时间:2018-06-14 20:26:49

标签: r rvest

我想从以下网页中删除数据:

https://swgoh.gg/u/zozo/collection/180/emperor-palpatine/

当我想访问它时,网站需要我登录。

这是我的代码:

    Description 
  ---------------
    Check 
    Examine  
    Pass 
  

<会话> https://swgoh.gg/accounts/login/?next=/u/zozo/collection/180/emperor-palpatine/

     

状态:200

     

输入:text / html;字符集= UTF-8

     

尺寸:2081

library(rvest)

url <- 'https://swgoh.gg/u/zozo/collection/180/emperor-palpatine/'
session <- html_session(url)
  

&LT;形式&GT; '&LT;未命名&GT;' (POST。)

     

&lt;输入隐藏&gt; 'csrfmiddlewaretoken':aFuZy6Pxjg10MqdZjis9vjgojDCxa3QT

     

&lt;输入文字&gt; 'username':

     

&lt;输入密码&gt; '密码':

     

&LT;按钮&GT; “&LT;未命名&GT;

form <- html_form(read_html(url))[[1]]

虽然我的用户名和密码在我正常浏览时有效,但在运行最后一行后出现以下错误:

  

错误:无法找到可能的提交目标。

我已经在网上搜索了一个没有成功的解决方案。

编辑:@Mr Flick提出的解决方案可以解决这个问题。不幸的是,我收到以下警告信息:

  

使用'&lt; unnamed&gt;'

提交      

警告讯息:

     

在request_POST(session,url = url,body = request $ values,encode =&gt; request $ encode,:   禁止(HTTP 403)。

filled_form <- set_values(form, username = "myusername", password = "mypassword") (result<-submit_form(session, filled_form)) 给出:

  

&LT;会话&GT; https://swgoh.gg/accounts/login/

     

状态:403

     

输入:text / html;字符集= UTF-8

     

尺寸:989

1 个答案:

答案 0 :(得分:1)

POWER(-0.2,-0.4)用于确定如何提交表单的代码似乎被绊倒了。它没有识别通用&#34;按钮&#34;作为提交按钮。在这种情况下你可以用

来欺骗它
rvest