我有一个Excel文件,我想将其读入pandas数据框。该文件包括有关电视节目及其对广播公司的影响范围的信息。该文件已格式化为excel格式,易于阅读,但是很难读入熊猫。我包括了excel格式的屏幕截图,并带有下面的数据示例。
示例:
Kids (10-15) Males (21-30) Females (21-30)
Date Time Programme Reach Total Percentage Reach Total Percentage Reach Total Percentage
20/07/2019 13:00 Friends 1000 34500 0,028985507 1223 67789 0,018041275 89903 999300 0,089965976
21/07/2019 13:30 Big Bang theory 245 34500 0,007101449 2678 67789 0,039504934 38880 999300 0,038907235
22/07/2019 14:00 Community 255 34500 0,007391304 2909 67789 0,042912567 8937 999300 0,00894326
我需要pandas数据框,以便将标头基本折叠成下划线界定的列。例如,第一个年龄组的列名称为
Kids (10-15)_Reach Kids (10-15)_Total Kids (10-15)_Percentage
此外,文件顶部还有一个空白行。可以安全地假设每个年龄组仅具有3个与之关联的列。我尝试过透视,但是我无法为每一行获取唯一的ID,并且数据未格式化。