熊猫数据框功能

时间:2019-02-19 00:56:43

标签: dataframe

我想使用excel电子表格作为源数据来创建数据框。我需要将数据系列从excel电子表格中用于存储数据的格式转换为dataframe可变最终产品。

我想知道用户是否有使用各种python方法完成以下任务的经验:

-数据系列转换:我有一个系列,每个系列每月包含一个数据值,但想使用索引(或带有日期值的列)将值表扩展为每天包含一个值。因此,如果table1具有基于月份的索引,而table2具有每日索引,则如何将table1的值转换为基于table2的索引。

-dataframe雕刻:我正在使用的数据长度不同,有些数据集比另一些更长。在多列数据帧的上下文中,可以通过什么方法找到一列中最短的序列长度?

从本质上讲,我想从工作簿中获取单个表,并将它们组合为一个数据框,该数据框使用单个索引值作为其表示的基础。我的工作簿表可能具有每日,每周或每月的数据点频率,我想构建一个数据框,该数据框使用每日索引作为表格元素的基础,同时包括每周和每月的系列每天的元素。

我正在查看Pandas库,但是也许我忽略了其他具有附加功能的库。

感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

对于第一个问题,请尝试以下操作:

df1 = df1.resample('1d').first()
df2.merge(df1)

这将对您的每月或每周数据框进行升采样,并将其与每日数据框合并。看一下interpolate method来填写缺失值。要获得最短列的名称,请尝试以下方法:

df.count().idxmin()

希望有帮助!