扫描和阅读线

时间:2016-09-08 10:11:33

标签: r function

在R中,scanreadLines在文件读取方面具有相同的功能,但输出类别不同。为了获得进一步步骤的向量,我在阅读文件时使用scan。但是,其中一个文本文件总是出现错误,如下所示:

filt <- "E:/lexicon/wenku_baidu_com/stopwords_cn.txt"
specialfilter <- scan(file = filt, what=character(), nmax = -1, sep = "\n", blank.lines.skip = TRUE, skipNul = TRUE, fileEncoding = "UTF-8")
Read 1 item
Warning message:
In scan(file = filt, what = character(), nmax = -1, sep = "\n",  :
  invalid input found on input connection 'E:/lexicon/wenku_baidu_com/stopwords_cn.txt'

环境已多次检查,没有目录错误,没有编码错误(文件编码为UTF-8)。这个文件中的显着特征是它有数千行。如果使用readLines,则根本没有错误:

specialfilter<-readLines(filt, encoding = "UTF-8", skipNul = FALSE)

我的问题是:

  1. scan是否对阅读文件有行限制?如果答案是 “是”,它可以在一个文件中读取多少行?
  2. 如果在这种情况下,我们只能使用readLines,如何更改 结果(specialfilter)进入vector?
  3. PS:上传到网络存储中的文件,其唯一的12kb:https://yunpan.cn/OcMTMXyFXNQzYu访问代码为3c9d

0 个答案:

没有答案