Rvest并且无法连接

时间:2017-10-11 17:56:52

标签: r web-scraping rvest

我的妻子希望获取我们在线医疗博客的所有条目。我认为这是一个尝试webscraping的好机会,因为复制粘贴会花费很长时间。我的代码如下:

library(rvest)
url <- "http://www.carepages.com/"
pgsession <-html_session(url)
pgform <- html_form(pgsession)[[1]]
filled_form <- set_values(pgform,
                  'session[email]' = "myemail@email.com"
                  'session[password]' = "mypassword")
submit_form(pgsession,filled_form)

然而,当我运行这个时,我得到了一个

curl :: curl_fetch_memory(url,handle = handle)出错:   无法连接到www.carepages.com端口80:超时

甚至无法进入页面尝试抓取每个博客。

1 个答案:

答案 0 :(得分:0)

显示的代码应该发生的第一个错误是

bot.onText(/\/start/, async  msg => {
    const opts = {
        reply_markup: {
            inline_keyboard: [
                [{
                    text: `telegram.me/fullmovie_bot?start=${msg.chat.id}`,
                    callback_data: ``
                }]
            ]
        }
    };
await bot.sendMessage(msg.chat.id, `Share and Start my Bot`, opts);
});

...与Error: unexpected string constant in: " 'session[email]' = "myemail@email.com" 'session[password]'"

之后缺少的逗号有关

在htat页面上使用第二种形式:

"myemail@email.com"