readr :: read_tsv错误:“无效的多字节序列”

时间:2019-05-22 12:43:13

标签: r readr

我正在尝试使用readr::read_tsv读取tsv文件,但该错误出了点问题:

Error in read_tokens_(data, tokenizer, col_specs, col_names, locale_,  : 
   Invalid multibyte sequence

“编码”设置似乎是一个简单的问题。我像往常一样使用编码为'CP932'的语言环境进行了更改,并且它与标题行一起使用。但是当给'n_max'值'Inf'时,上面的错误就停止了。我也尝试编码'UTF-8',读取除原始字符外的所有行。

# without error
df1 <- read_tsv(file, n_max = 10, locale = locale(encoding = "CP932"))
# got error above
df2 <- read_tsv(file, n_max = Inf, locale = locale(encoding = "CP932"))

重点可能是相对于列名而言,列值较少。因此,我想弄清楚如何使用readr::read_tsv来读取整行,其编码值为'CP932'或其他解决方案。

0 个答案:

没有答案