Scopus_ReadCSV {CITAN}无法使用从Scopus导出的csv文件

时间:2016-09-21 11:33:08

标签: r csv scopus

我在Windows 7上使用Rstudio和R 3.3.1,我已经安装了CITAN包。我正在尝试从我从Scopus导出的CSV文件中导入参考书目条目(原样,未触及),选择导出所有可用信息。

这是我得到的错误:

example <- Scopus_ReadCSV("scopus.csv")
  

Scopus_ReadCSV中的错误(&#34; scopus.csv&#34;):未找到列:`Source&#39;。   另外:警告信息:

     

1:在read.table中(file = file,header = header,sep = sep,quote = quote,:     在输入连接上找到无效输入&#39; scopus.csv&#39;

     

2:在read.table中(file = file,header = header,sep = sep,quote = quote,:     readTableHeader在scopus.csv&#39;

上找到的不完整的最后一行

专栏`来源&#39;我打开文件的时候有,所以我不知道为什么它说'找不到&#39;。

2 个答案:

答案 0 :(得分:1)

最终我得出以下结论:

  1. 从Scopus导出的CSV文件的编码是UTF-8-BOM,当使用Scopus_readCSV(“file.csv”)或read.table(“文件”时,似乎无法从R识别。 csv“,header = TRUE,sep =”,“,fileEncoding =”UTF-8“)。

  2. 虽然它是Scopus文件的编码类型,但是可以找到一些“奇怪的”非英文字符,这些字符在R中的读取函数中是不可读的。(主要是在名称中找到此问题)特殊字符)

  3. 解决这些问题的方法:

    1. 使用记事本应用程序(如Notepad ++)打开CSV文件,并使用UTF-8编码保存文件,以便将R读取为UTF-8。

    2. 在R中运行读取功能时,您会注意到它停止读取(例如,在200个注册表中的第40个)。看看它到底停在哪里,这样你可以通过用记事本打开CSV找到特殊字符,然后你可以根据需要删除/更改它,以便再次在R中没有相同的问题。

答案 1 :(得分:0)

另一个对我有用的解决方案:

在 Google 表格中打开文件,然后从那里再次将其下载为 *.csv 文件。 R 之后正确打开它。