我正在尝试使用readr::read_tsv
读取tsv文件,但该错误出了点问题:
Error in read_tokens_(data, tokenizer, col_specs, col_names, locale_, :
Invalid multibyte sequence
“编码”设置似乎是一个简单的问题。我像往常一样使用编码为'CP932'的语言环境进行了更改,并且它与标题行一起使用。但是当给'n_max'值'Inf'时,上面的错误就停止了。我也尝试编码'UTF-8',读取除原始字符外的所有行。
# without error
df1 <- read_tsv(file, n_max = 10, locale = locale(encoding = "CP932"))
# got error above
df2 <- read_tsv(file, n_max = Inf, locale = locale(encoding = "CP932"))
重点可能是相对于列名而言,列值较少。因此,我想弄清楚如何使用readr::read_tsv
来读取整行,其编码值为'CP932'或其他解决方案。