将CSV文件读为乱码

时间:2016-05-01 06:19:20

标签: r

我下载了一个用于课程讲座的CSV文件。具体来说,我从https://data.baltimorecity.gov/Transportation/Baltimore-Fixed-Speed-Cameras/dz54-2aru

下载了定速摄像机的数据

该网站以CSV格式整齐地提供数据。 excel数据看起来很好。但是,当我把它读到R中时,通过read.table我得到了胡言乱语,例如:

     1. http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd>
    2   <!--[if IE 8]>
    3     <html xmlns=http://www.w3.org/1999/xhtml xml:lang=en lang=en
    4           xmlns:v=urn:schemas-microsoft-com:vml
    5           xmlns:og=http://opengraphprotocol.org/schema/ class=ie ie8 noBorderRadius noLinearGradient noCss3><![endif]-->
    6   <!--[if gte IE 9]>
    7     <html xmlns=http://www.w3.org/1999/xhtml xml:lang=en
    8           xmlns:v=urn:schemas-microsoft-com:vml
    9           xmlns:og=http://opengraphprotocol.org/schema/ lang=en class=ie><!      
[endif]-->
    10  <!--[if !IE]>-->
    11    <html xmlns=http://www.w3.org/1999/xhtml xml:lang=en lang=en

我哪里出错了?

1 个答案:

答案 0 :(得分:1)

由于您没有发布代码,因此很难确定您出错的地方,但看起来您正在尝试打开xml文件,而不是csv。我从您列出的网站下载了“Baltimore_Fixed_Speed_Cameras.csv”。导出为纯CSV。然后,以下代码将其导入R:

data <- read.csv("Baltimore_Fixed_Speed_Cameras.csv", header=T)

> head(data)
                         address direction      street  crossStreet               intersection                      Location.1
1       S CATON AVE & BENSON AVE       N/B   Caton Ave   Benson Ave     Caton Ave & Benson Ave (39.2693779962, -76.6688185297)
2       S CATON AVE & BENSON AVE       S/B   Caton Ave   Benson Ave     Caton Ave & Benson Ave (39.2693157898, -76.6689698176)
3 WILKENS AVE & PINE HEIGHTS AVE       E/B Wilkens Ave Pine Heights Wilkens Ave & Pine Heights  (39.2720252302, -76.676960806)
4        THE ALAMEDA & E 33RD ST       S/B The Alameda      33rd St     The Alameda  & 33rd St (39.3285013141, -76.5953545714)
5        E 33RD ST & THE ALAMEDA       E/B      E 33rd  The Alameda      E 33rd  & The Alameda (39.3283410623, -76.5953594625)
6        ERDMAN AVE & N MACON ST       E/B      Erdman     Macon St         Erdman  & Macon St (39.3068045671, -76.5593167803)

在纯文本编辑器中打开您的文件,以确保它真的只是一个vanilla csv文件。