这是一个简单的问题,但我认为以前没有问过。
如果我有一个数据帧列表(由于多处理,它们需要采用这种格式),
df_list=[df1,df2,...,dfn]
是否有一种优雅的方式来追加所有这些?一个衬垫会更好。
答案 0 :(得分:4)
以下并行处理示例使用concat方法在IPython中工作:
from IPython import parallel
clients = parallel.Client() #a lightweight handle on all the engines of a cluster
clients.block = True # use synchronous computations
print(clients.ids)
dview = clients[:] #dview = clients.direct_view()
dview.block = True
dview.scatter("experiment", myDataFrame) # <myDataFrame> scattered as <experiment> to the engines
dview["wlist_ptrn"] = wlist_ptrn
dview.execute("experiment['allFeats'] = experiment.ttext.str.findall(wlist_ptrn)")
return pd.concat(dview.gather("experiment")) # gather method returns a list of data frames
我希望它对多处理模块输出有用。