我是python的新手,正在尝试创建一个程序来帮助我读取excel文件并将数据从其中加载到不同的数据帧中。
我在同一列中有一个Excel文件,其中包含不同的数据。我想编写一个可以通过此列的代码,并由此为每组单元格创建一个新的数据框。每次列更改为另一个数据组时,该代码都应能够识别。然后将这些数据组保存到每个相应的数据框中。
我试图找到一种使用pd.read_excel()
的方法,但是我不能不提出任何.read_excel()
识别列何时更改的方法。
Excel示例:
在excel中可以看到,我需要将列拆分为不同的数据框。
我有一些实际数据:
答案 0 :(得分:0)
首先使用read_excel()
读入一个数据帧。
在一个数据帧中,您可以处理该数据帧以创建所需的不同数据帧。
如果原始行的顺序很重要,则可以使用iterrows()
遍历数据框。检查this link以获得有关iterrows()
的更多信息。
如果原始行的顺序无关紧要,那么您将使用正则表达式(regex)在数据框中创建一个新列,其中与该列的前几个字符匹配。一旦在数据框中添加了新列,就可以很容易地对其进行分组或拆分。
(此评论基于查看您的数据,这似乎暗示您正在YFAO-123诉USW9-123上分裂。)