表格中有很多记录。查询时间增加了很多。所以我需要使用解码方法将行作为列。例如:
import dask.dataframe as dd
df = dd.read_hdf('large.h5', key='data', chunksize=10000, mode='r', sorted_index=False)
我需要输出如下
Empid Date type value
1 01-Jan-2018 Att 1.0
2 01-Jan-2018 Att 0.5
3 01-Jan-2018 Lev 1.0
1 02-Jan-2018 Att 0.5
1 03-Jan-2018 Att 1.0
2 03-Jan-2018 Att 1.0