当我解析R中的网站时,(系统:R + debian)控制台中的html对象输出让我感到不舒服。
线之间的差距很大。我怎样才能使它正常,缩小线之间的差距?
也许您可以使用以下代码查看相同的输出。
options(encoding="gbk")
library(XML)
baseURL <- "http://www.jb51.net/article/27174.htm"
txt <- readLines(baseURL)
txt
答案 0 :(得分:1)
有趣的是,似乎当print
- 向量时,最长的元素决定了所有元素的间隔方式。
你最长的字符串是txt[374]
:在我的屏幕上,它需要19行;这意味着txt
的每个元素都将使用19行打印,可能有很多空格。
打印列表时没有这个问题,所以解决方法是:
print(as.list(txt))
答案 1 :(得分:0)
尝试使用gsub()
替换空格。