Question

我有此示例excel和示例数据：

我的问题是，如何获取具有相同EmployeeID的所有行并将其保存到新表中。例如，在上面的图片中，如何将黄色的行保存在新的工作表中但具有相同的excel文件中。

我有以下代码，但它只是在创建一个新表：

writer = ExcelWriter('Employee Timesheet.xlsx')
df.insert(loc=0, column='Number', value=range(1,max_row+1-4))


for i in range(5,max_row+1):
  for j in range(2,3):
    cell_obj=ws.cell(row=i,column=j)
    cell_obj1=ws.cell(row=i+1,column=j)
  if cell_obj.value != cell_obj1.value:
    #sample only on creating a new sheet
    counter = 5
    for count in range(1,counter):
        sheet_name = 'Sheet%s' % count
        df.to_excel(writer, sheet_name=sheet_name, index=False)

writer.save()

请有人给我一个关于如何迭代行并将所有内容保存在新表中的想法。谢谢！

Answer 1

我希望这可以证明是有用的，我有一个这样的数据框：

#!/usr/bin/python
from numpy import nan
import pandas as pd

my_df=pd.DataFrame({'ID':['Sample1', 'Sample1', 'Sample1', 'Sample1', 'Sample2', 'Sample2', 'Sample2', 'Sample2', 'Sample3', 'Sample3'],
'Purchase':[4, 5, 6, 7, 8, 9, 10, 11, 12, 13],'item':['Item1', 'Item2', nan, 'Item4', 'Item5', 'Item6', 'Item7', nan, nan, nan],})
my_df
      ID        Purchase   item
0     Sample1         4  Item1
1     Sample1         5  Item2
2     Sample1         6    NaN
3     Sample1         7  Item4
4     Sample2         8  Item5
5     Sample2         9  Item6
6     Sample2        10  Item7
7     Sample2        11    NaN
8     Sample3        12    NaN
9     Sample3        13    NaN

可以将第一列中具有重复值的样本提取到字典中，然后提取到也可以与excel一起使用的单独的csv文件中：

dict_of_dataframe = {k: v for k, v in my_df.groupby('ID')} # Group based on ID, 
for key,value in dict_of_companies.items():
    with open(key, 'w+') as f:
        f.write(str(value))

f.close()

这将基于第一列中重复的值生成csv文件。

Python熊猫：在Excel中获取特定行并保存到新表中

1 个答案: