我使用以下代码NaN
/ HDFStore
在python
中存储包含大量pandas
值的大数据集:
with get_store(work_path+'/stores/store.h5') as store:
for chunk in reader:
for column in column_list:
store.append('%s' % column, chunk[column],
data_columns=column)
然后我想将第一列加载为numpy
数组,所以我有:
array = store.select(column_list[0]).as_matrix()
问题是我得到一个没有任何初始NaN
值的小数组,因为当我将数据存储在商店中时,它有点"忘记" NaN
值,仅保留非NaN
值及其索引。如何使用初始NaN
值返回数组?