熊猫过滤数据

时间:2020-10-24 20:51:17

标签: python pandas dataframe

我有来自Bing的数据集。该数据集包含州和县级信息。我正在尝试创建两个不同的数据集,一个用于县级,一个用于州级。

如何创建仅状态级别的数据帧。这是数据集的外观图片:

enter image description here

县级数据框使用此代码

import pandas as pd

df = pd.read_csv("COVID19-DATA-WITHSTATES.csv")

only_counties = df[df['AdminRegion2'].str.contains("", na = True)]

此代码不适用于州级代码:

only_states = df[df['AdminRegion2' != ""]]

编辑:这是有效的代码

only_states = usa_only[lambda x: ~pd.notnull(x['AdminRegion2']) & (usa_only["AdminRegion1"].str.contains("", na = False))]

2 个答案:

答案 0 :(得分:1)

您可以使用lambda表达式对其进行过滤:

only_states = df[lambda x: ~pd.isnull(x['AdminRegion2'])]

对于第二个问题,上述解决方案也适用:

df[lambda x: x['date'] == "date"]

答案 1 :(得分:0)

这是仅适用于有效状态的答案。

def reverse_recursion(string):
    if len(string) == 0:
        return string
    else:
        return reverse_recursion(string[1:]) + string[0]