选择行号以从excel读取到pandas数据框

时间:2018-12-17 16:14:13

标签: python excel pandas

我有一个共享电子表格,每天都会向其中添加行。我正在创建一个脚本,该脚本将电子表格读入数据框pd.read_excel(infile, sheet_name=0),并使用df.drop_duplicates(keep='first')检查重复的行。该脚本将成为多人计算机上的已安装软件包,以供他们随时使用,并且不同的人将希望检查不同的行。有没有办法让想要使用脚本的人选择他们要检查的行范围?例如,如果电子表格有100行,并且有人要检查40-60行中是否有重复的行,是否可以这样做?

1 个答案:

答案 0 :(得分:1)

您可以接受用户输入的行边界,然后将其传递给iloc

import pandas as pd

start = int(input('Enter your starting row: '))
stop = int(input('Enter your ending row: '))

df_limited = df.iloc[start:stop].drop_duplicates(keep='first')