如何在R

时间:2015-04-30 16:45:12

标签: html r string stringr

我正在使用R进行网页抓取,我有一个脚本复制链接的文本,然后使用此字符串来跟踪使用RSelenium的链接。不幸的是,当我运行脚本时,这对于一个特定的字符串似乎不起作用,但是当我用手动键入的字符串替换保存的字符串时,它可以正常工作。稍微深入一下页面的html就会发现其中一个空格字符实际上是一个字符,这就是字符串无法匹配的原因。如何用R中的普通空格替换?我尝试使用stringr库和str_replace命令,如下所示:

var1 <- str_replace(var1, pattern = "&nbsp;", " ")

但这似乎不起作用。有什么我明显做错了吗?有没有办法让R显示一个字符串,所有奇怪的格式字符可见?

1 个答案:

答案 0 :(得分:1)

您需要\u00A0作为替换字符 所以var1 <- gsub("\u00A0", "", var1, fixed =TRUE)