我有包含多个国家/地区的数据集。 如何过滤它,使其仅包含特定国家/地区?
例如,现在包含英国,比利时,法国,...等
我希望对其进行过滤,以便仅显示法国和比利时。
到目前为止,我已经尝试过:
dataset = dataset.loc[dataset.Country == "France"].copy()
dataset.head()
它有效,因为它只过滤法国的数据,但是如果我添加比利时
dataset = dataset.loc[dataset.Country == "France","Belgium"].copy()
dataset.head()
它不再起作用。 我收到以下错误:
'the label [Belgium] is not in the [columns]'
我们将不胜感激任何帮助。
答案 0 :(得分:2)
您尝试的操作失败了,因为它将'Belgium'
视为要查找的列,该列不存在。如果要针对多个值进行过滤,请使用isin
:
dataset = dataset[dataset['Country'].isin([ "France","Belgium"])].copy()
当您使用loc
时,将逗号后的参数视为要查找的标签,在这种情况下是在列轴上