如何访问许多已建立的行

时间:2018-08-11 15:00:49

标签: python excel pandas openpyxl

我在使用openpyxl时遇到问题,但是用户EricH. Trizi解决了该问题。不幸的是,还有另一个问题。他们给了我解决方案,如何选择包含某些产品名称的行(在这种情况下为ABC),但是我不知道如何分别访问搜索结果。

Excel report

这是Eric的代码:

from openpyxl import load_workbook
wb = load_workbook("report.xlsx")
ws = wb.active

for row in ws.rows:
   if row[4].value == "ABC":
       for cell in row:
           print(cell.value, end=" ")
       print()

这是H. Trizi的:

    import pandas as pd

    df = pd.read_excel("path_to_excel_file")
    df_abc = df[df["Products"] == "ABC"] # this will only contain 2,4,6 rows

在选择包含“ ABC”产品的所有行时,它们都很好用,但是有没有办法分别访问包含ABC产品名称的每一行(然后是其中的每个单元格)?

我要实现的目标是分别访问产品名称为ABC的每一行,然后将其单元格保存到变量中。

因此,请逐步: 1,用ABC产品查找所有行(在这种情况下为2、4、6)-由Eric和H.Trizi解决 2.获取第2行并将其细分为将分配给变量(名称,姓氏,订单号等)的单元格 3.对第4行执行相同的操作 4.对第6行执行相同的操作 5.等 PS。数据在Excel报告中可用

1 个答案:

答案 0 :(得分:2)

您可以使用非常慢的iterrows

for i, row in df_abc.iterrows():
    print (i)
    name = row['name']
    surname = row['surname']

或者更快一点itertuples

for i in df_abc.itertuples():
    name = i.name
    surname = i.surname

另一种解决方案是将to_dict过滤的DataFrame转换为词典列表,它应该是最快的:

L = df_abc.to_dict(orient='r')

for x in L:
    print (x)
    name = x['name']
    surname = x['surname']

示例

df = pd.DataFrame({'surname':list('abcdef'),
                   'Products':['ABC','ABC','d','d','ABC','f'],
                   'val':[7,8,9,4,2,3],
                   'name':list('DFERTH')})

print (df)
  surname Products  val name
0       a      ABC    7    D
1       b      ABC    8    F
2       c        d    9    E
3       d        d    4    R
4       e      ABC    2    T
5       f        f    3    H

df_abc = df[df["Products"] == "ABC"]
print (df_abc)
  surname Products  val name
0       a      ABC    7    D
1       b      ABC    8    F
4       e      ABC    2    T

L = df_abc.to_dict(orient='r')
print (L)
[{'surname': 'a', 'Products': 'ABC', 'val': 7, 'name': 'D'},
 {'surname': 'b', 'Products': 'ABC', 'val': 8, 'name': 'F'},
 {'surname': 'e', 'Products': 'ABC', 'val': 2, 'name': 'T'}]

for x in L:
    print (x)
    print (x['name'])
    print (x['surname'])

D
a
{'surname': 'b', 'Products': 'ABC', 'val': 8, 'name': 'F'}
F
b
{'surname': 'e', 'Products': 'ABC', 'val': 2, 'name': 'T'}
T
e    

编辑:

要分别选择每个值variable-没必要,因为可以使用list of dictionary,所以通过索引选择每个dictionary,然后选择dict的每个值:

#selected first dictionary of list by indexing ([0]) and then dictionary by key (name)
print (L[0]['name'])
D
print (L[0]['surname'])
a

print (L[1]['name'])
F
print (L[1]['surname'])
b

print (L[2]['name'])
T
print (L[2]['surname'])
e