我最近发现芝加哥犯罪数据网站提供CSV导出。在使用readr导入6.2M +记录时,我注意到所有日期记录的时间在12:00:00 PM到12:59:59 PM之间无法读取。
我使用以下内容导入:
chicagocrime = read_csv("~/R/chicago_Crime/Crimes_-_2001_to_present 20161203.csv", col_types = cols( Date = col_datetime(format = "%m/%d/%Y %H:%M:%S %p"), Location = col_skip(), `Updated On` = col_skip(), `X Coordinate` = col_skip(), `Y Coordinate` = col_skip() ) )
问题()显示如下:
problems(chicagocrime) # A tibble: 156 × 4 row col expected actual 1 12 Date valid date 06/13/2005 12:40:00 PM 2 20 Date valid date 04/06/2005 12:30:00 PM 3 24 Date valid date 06/13/2005 12:45:00 PM 4 32 Date valid date 06/12/2005 12:00:00 PM 5 43 Date valid date 06/03/2005 12:00:00 PM 6 53 Date valid date 03/20/2005 12:00:00 PM 7 61 Date valid date 06/15/2005 12:33:00 PM 8 80 Date valid date 06/13/2005 12:30:00 PM 9 104 Date valid date 06/13/2005 12:46:17 PM 10 143 Date valid date 06/12/2005 12:12:30 PM
所有其他时间导入没有问题。
输入文件的格式为日期格式:“04/06/2005 12:30:00 PM”。任何帮助或评论? (Windows 10上的R 3.3.2,最新软件包)