我有一个数据框,如:
import ipaddress
try:
ipaddress.IPv4Address(addr)
print("yes IP matched")
except ipaddress.AddressValueError:
print("no have not matched")
输出应为: -
Company Country
ABC USA
ABC USA
BCD USA
BCD USA
ABC USA
答案 0 :(得分:3)
如果所有列中都需要唯一值,我认为您需要drop_duplicates
:
df = df.drop_duplicates()
print (df)
Company Country
0 ABC USA
2 BCD USA
或者,如果需要为检查重复项指定列,请添加参数subset
:
df = df.drop_duplicates(subset=['Company'])
print (df)
Company Country
0 ABC USA
2 BCD USA
df = df.groupby('Company', as_index=False).first()
print (df)
Company Country
0 ABC USA
1 BCD USA
答案 1 :(得分:2)
为了完整起见,您还可以使用:
signOut