我是熊猫新手,希望能有所帮助。阅读文档,但找不到解决方案...
我创建了一个pd.Series(使用groupby并应用两个参数)。有数千个索引,每个索引都有一组代码(param_b)。我正在尝试删除出现在多个索引中的代码。
我尝试了.feed(times)
.repeat("${times}") {
// some stuff
}
,但是它什么也没做...
drop_duplicates
我使用families = file.groupby("param_a")["param_b"].apply(set)
new_families = families.drop_duplicates()
an example, I have these three lines:
A {5iv5, 5iv7}
B {5hx2, 2fl8, 2fl9, 5iv5, 5iv7, 2fkk}
C {4lq8}
I want to remove the entries that appear in A and B (5iv5, 5iv7)
删除了apply(set)
中的重复项,并且可行,但是我还需要删除不同索引中的重复项。
谢谢!
答案 0 :(得分:0)
这可以满足您的要求:
npm run test:watch
但是我不确定是否有更有效的解决方案。