我有一个共享电子表格,每天都会向其中添加行。我正在创建一个脚本,该脚本将电子表格读入数据框pd.read_excel(infile, sheet_name=0)
,并使用df.drop_duplicates(keep='first')
检查重复的行。该脚本将成为多人计算机上的已安装软件包,以供他们随时使用,并且不同的人将希望检查不同的行。有没有办法让想要使用脚本的人选择他们要检查的行范围?例如,如果电子表格有100行,并且有人要检查40-60行中是否有重复的行,是否可以这样做?
答案 0 :(得分:1)
您可以接受用户输入的行边界,然后将其传递给iloc
:
import pandas as pd
start = int(input('Enter your starting row: '))
stop = int(input('Enter your ending row: '))
df_limited = df.iloc[start:stop].drop_duplicates(keep='first')