从Excel文件格式化熊猫数据框

时间:2019-09-16 08:44:11

标签: python pandas

我有一个Excel文件,我想将其读入pandas数据框。该文件包括有关电视节目及其对广播公司的影响范围的信息。该文件已格式化为excel格式,易于阅读,但是很难读入熊猫。我包括了excel格式的屏幕截图,并带有下面的数据示例。

enter image description here

示例:

                            Kids (10-15)                Males (21-30)               Females (21-30)     
Date    Time    Programme   Reach   Total   Percentage      Reach   Total   Percentage      Reach   Total   Percentage
20/07/2019  13:00   Friends 1000    34500   0,028985507     1223    67789   0,018041275     89903   999300  0,089965976
21/07/2019  13:30   Big Bang theory 245 34500   0,007101449     2678    67789   0,039504934     38880   999300  0,038907235
22/07/2019  14:00   Community   255 34500   0,007391304     2909    67789   0,042912567     8937    999300  0,00894326

我需要pandas数据框,以便将标头基本折叠成下划线界定的列。例如,第一个年龄组的列名称为

Kids (10-15)_Reach   Kids (10-15)_Total    Kids (10-15)_Percentage

此外,文件顶部还有一个空白行。可以安全地假设每个年龄组仅具有3个与之关联的列。我尝试过透视,但是我无法为每一行获取唯一的ID,并且数据未格式化。

0 个答案:

没有答案
相关问题