目前我正在调查R中的“getURL”和“download.file”命令。到目前为止,两者都像魅力一样。
但是,我遇到一个特定链接的问题,我不知道为什么这个链接不起作用。
运行
getURL
("http://www.r-bloggers.com/improving-script_002-%e2%80%9cmonitor%e2%80%9d/")
产生错误:
curlPerform出错(curl = curl,.opts = opts,.encoding = .encoding): 在字符串中嵌入nul:'\ 037 \ b'
“download.file”命令还会创建一个奇怪的编码文件:
download.file
("http://www.r-bloggers.com/improving-script_002-%e2%80%9cmonitor%e2%80%9d/",
"test.html")
这对你有用吗?
答案 0 :(得分:7)
问题是网址中的引号。您需要先对其进行编码。这将正常工作。
getURL(URLencode("http://www.r-bloggers.com/improving-script_002-%E2%80%9Cmonitor%E2%80%9D/"))