我有来自Bing的数据集。该数据集包含州和县级信息。我正在尝试创建两个不同的数据集,一个用于县级,一个用于州级。
如何创建仅状态级别的数据帧。这是数据集的外观图片:
县级数据框使用此代码
import pandas as pd
df = pd.read_csv("COVID19-DATA-WITHSTATES.csv")
only_counties = df[df['AdminRegion2'].str.contains("", na = True)]
此代码不适用于州级代码:
only_states = df[df['AdminRegion2' != ""]]
编辑:这是有效的代码
only_states = usa_only[lambda x: ~pd.notnull(x['AdminRegion2']) & (usa_only["AdminRegion1"].str.contains("", na = False))]
答案 0 :(得分:1)
您可以使用lambda表达式对其进行过滤:
only_states = df[lambda x: ~pd.isnull(x['AdminRegion2'])]
对于第二个问题,上述解决方案也适用:
df[lambda x: x['date'] == "date"]
答案 1 :(得分:0)
这是仅适用于有效状态的答案。
def reverse_recursion(string):
if len(string) == 0:
return string
else:
return reverse_recursion(string[1:]) + string[0]