如果在发布此问题时做错了任何事情,我会提前道歉。我是编码以及stackoverflow社区的新手。
以下是我的代码:
def duplicate_check(sheet_name, filename, last_row_column, dupe_column):
data = pd.read_csv(filename)
last_record = (data[last_row_column].last_valid_index())
df2 = data.loc[:last_record]
indices = df2[(df2[dupe_column]).isnull()].index
duplicates = df2.duplicated(subset=[dupe_column], keep=False)
duplicates_sum = duplicates.sum()
duplicate_data = (data.loc[duplicates, :])
export_csv = duplicate_data.to_csv(full_file_string,index=None,)
我收到以下错误:
不可对齐的布尔系列提供为 pandas.core.indexing.IndexingError:作为索引器提供了不可对齐的布尔系列(布尔系列和被索引对象的索引不匹配)。
我看过this示例,但是由于我已经在使用'loc',因此我不确定如何将解决方案应用于代码。
预期的输出是将重复项保存到csv中。请让我知道我是否需要澄清!我非常感谢收到的任何帮助,这让我发疯。