初始化一个dask系列

时间:2017-09-05 19:59:47

标签: python pandas dask

我试图在dask数据框中添加一个列,但它不允许我添加类型列的列,所以我达到了一点,发现它会添加一个dask系列。但是我无法将我的列表转换为dask系列。你能救我一下吗?

2 个答案:

答案 0 :(得分:0)

如果列表适合内存,您可以将列表转换为pandas Dataframe:

import pandas as pd  
import dask.dataframe as dd  
import numpy as np

df = pd.DataFrame(np.random.random_integers(0,6,size=(20, 6)),
columns=list('ABCDEF'))   data = dd.from_pandas(df, npartitions = 2)

listadd = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,18, 19, 20] 
listadd = pd.DataFrame(listadd)

data[['G']] = listadd

print data.compute()

答案 1 :(得分:0)

dask.dataframe.from_pandas(pandas.Series(my_data), npartitions=n)是您所需要的。 from_pandas都接受pandas.DataFrame/Series