所以我正在从csv中读取一个2D数组并将其转换为numpy数组,如下所示:
sheet = pd.read_csv('data.csv')
sheet_data = sheet.as_matrix()
我可以成功地将此2D阵列中的'N'和'Y'的值分别替换为0和1。
np.place(sheet_data, sheet_data == 'N', 0)
np.place(sheet_data, sheet_data == 'Y', 1)
但是,此数据集的第二和第三列是'%Y-%m-%d%H:%M:%S'形式的时间戳,但我不知道如何使用np.place来用自纪元以来的秒数替换值。
此外,其中一些值也记录为NaN,但这两行中没有一行成功地将它们替换为0:
np.place(taxi_sheet_data, taxi_sheet_data == 'nan', 0)
np.place(taxi_sheet_data, taxi_sheet_data == float('NaN'), 0)
我该怎么做呢?
sheet_data中的第一项作为参考,如下所示:
[2 '2016-06-01 02:46:38' '2016-06-01 03:06:40' 0 1 -73.93058013916014
40.695178985595696 -74.00005340576173 40.72904586791992 1 5.24 19.5 0.5
0.5 6.24 0.0 nan 0.3 27.04 1 1.0]