我尝试运行以下代码。
path="path"
df=pd.read_csv(path, header=0, delimiter=',',dtype=str)
df=df.loc[~df["x"].isin(df["y"]),:]
产生以下错误
TypeError: '>' not supported between instances of 'str' and 'float'
经过一番调查后,我发现dtype实际上是一个对象。这会导致错误吗? 有没有办法解决这个问题,而不必迭代超过7列300万行来修复数据类型?
数据如下:
x y z
DE120 UK354 4506
UK354 AT235 9783
FE560 DK645 4652
IT456 NL978 7831
我想排除x也在y中的所有观察。 (z只是其他5个列中的一个,与这个故事完全无关,只是想让你知道它在那里)
x y z
DE120 UK354 4506
FE560 DK645 4652
IT456 NL978 7831