我试图在dask数据框中添加一个列,但它不允许我添加类型列的列,所以我达到了一点,发现它会添加一个dask系列。但是我无法将我的列表转换为dask系列。你能救我一下吗?
答案 0 :(得分:0)
如果列表适合内存,您可以将列表转换为pandas Dataframe:
import pandas as pd
import dask.dataframe as dd
import numpy as np
df = pd.DataFrame(np.random.random_integers(0,6,size=(20, 6)),
columns=list('ABCDEF')) data = dd.from_pandas(df, npartitions = 2)
listadd = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,18, 19, 20]
listadd = pd.DataFrame(listadd)
data[['G']] = listadd
print data.compute()
答案 1 :(得分:0)
dask.dataframe.from_pandas(pandas.Series(my_data), npartitions=n)
是您所需要的。 from_pandas
都接受pandas.DataFrame/Series
。