R在Windows中读取带符号的文件

时间:2016-03-20 16:37:53

标签: r encoding utf-8

我无法从带有异常符号的文件中读取数据;没有错误消息,但一旦遇到具有特定符号的行,它就会停止。

var markerListener = google.maps.event.addListener(marker, "click", function(event){
    /*****move map position****/
    map.setCenter(marker.getPosition());

    //send ajax requesting data based on id of marker clicked
    $.ajax({
        ...
        success: function(data) {
            //actual message     
            var html = "<a id='close' href='#'>close</a>" 
                + "<p>" + data.message + "</p>";
            setMapMessage(html, map);
            $("div#map_message").css("z-index", 5);
        } //end success for markerListener
    }); //end ajax for markerListener
});  //end markerListener

读入的最后一个字段是

temp = read.csv(filePaths[i], header=TRUE, sep="\t", comment.char="#")

在Excel中读取文件,实际上是:

Familial Non-VHL Clear Cell Renal Cancer;Birt-Hogg-Dub

但是“ - &gt;”是一个象征;我相信这实际上是“Birt-Hogg-Dubé综合症”,最后一个角色可能被解释为EOF char。

我在Windows上只有这个问题。

我尝试过使用不同的编码(encoding =“UTF-8”和encoding =“bytes”,fileEncoding =“UTF-8”),没有任何区别。我查看了Cannot read unicode .csv into R并进行了搜索,但无法轻易找到答案。请注意,我可能无法使用特定的语言编码。谢谢!

- 更新 - 创建了一个文件,其中包含一列,一个标题,3个条目(#2处有问题的条目),可在此处找到: https://www.dropbox.com/s/3m2wak8rhyab6j2/test.txt?dl=0

1 个答案:

答案 0 :(得分:0)

正如您所猜测的,您需要在阅读文件时更改文件编码。

  1. 确定编码you have

  2. 的文件
  3. 使用read.table通过fileEncoding指定文件编码