这里是熊猫的入门者。我有一个函数可以生成看起来像这样的项目列表:
['01/02/2020', '09:05:16', 29933, 2200, 6.8, 435, 1.35, 18, 16, 0.11, 'pre', '4033116']
如何从该列表创建带有列名的数据框?
所需的输出数据框如下所示:
Date Time Volume Rehandle Rehandle Pct...
01/02/2020 09:05:16 29933 2200 6.80 ...
我还想遍历这些列表中的一个列表,并创建包含成千上万个此类项目的数据框。 我该怎么做呢?
答案 0 :(得分:0)
好的,我实际上已经弄清楚了。我遇到了麻烦,因为我尝试仅使用一行数据来进行故障排除。通过列表列表后,一切都很好。
但是,我希望对代码进行一些建设性的批评。我能做些什么来改善它?
这是固定代码。
passdown_list_of_lists = []
for sort_data in sort_files_list[0]:
sort_instance = [passdown_generator(sort_data)]
passdown_list_of_lists.append(sort_instance[0])
sort_instance_ = [text_cleaner(passdown_generator(sort_data))]
cols = ['Date','Time','Volume','Rehandle','Rehandle PCT','Reject','Reject PCT','SS1 No Xmit','SS2 No Xmit','No Xmit PCT','Sort', 'Sort ID']
sort_data_df = pd.DataFrame(passdown_list_of_lists, columns=cols)
print(sort_data_df.head(3))