来自元组的python列表的dask数据框

时间:2018-10-16 07:19:20

标签: python pandas dataframe dask

我真的很陌生。我想从元组的python列表中创建一个dask数据框。在熊猫中,可以使用DataFrame.from_records将元组列表转换为数据框。什么功能可以让我快速获得相同的功能。 我的数据看起来像这样

  

[((21262,'booking','NULL'),(21262,'booking','NULL'),(21262,'booking','NULL'),(21262,'booking','') ,(21262,'booking','NULL')]

我现在正在使用此代码执行任务。这是正确的方法吗?

import pandas as pd
import dask
import dask.dataframe as dd

names = ['id', 'status', 'reg_entry']
dfs = dask.delayed(pd.DataFrame.from_records)(cursor.fetchall(), columns=names)

df = dd.from_delayed(dfs)

1 个答案:

答案 0 :(得分:3)

您可以尝试从现有的pandas数据框创建一个dask数据框(以便能够使用所有pandas构造函数):

df = pd.DataFrame([(21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', ''), (21262, 'booking', 'NULL')])
ddf = dd.from_pandas(df, npartitions=2)