我有一张表,其中一列是县名,另一列是各种属性。
我想将这列县名转换为fips代码。
我有一个中间表,显示每个县的fips代码。
这是我拥有哪些数据(初始和中间)以及我想要的数据(最终)的示例。
initial_df = {
'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'],
'values': [508, 364, 26, 870]
}
intermediate_df = {
'county': ['REAGAN', 'HARDEMAN', 'UPTON'],
'fips': [48383, 47069, 48461]
}
final_df = {
'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'],
'fips': [48383, 48461, 47069, 48461],
'values': [508, 364, 26, 870]
}
答案 0 :(得分:2)
您可以使用“合并”。
import pandas as pd
initial_df = {'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'], 'values': [508,
364, 26, 870]}
intermediate_df = {'county': ['REAGAN', 'HARDEMAN', 'UPTON'], 'fips': [48383, 47069,
48461]}
final_df = {'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'], 'fips': [48383,
48461, 47069, 48461], 'values': [508, 364, 26, 870]}
df1=pd.DataFrame(initial_df)
df2=pd.DataFrame(intermediate_df)
df3=df1.merge(df2)
print(df3)
,输出是您的final_df。
答案 1 :(得分:1)
这是一种方法:
initial_df = pd.DataFrame(initial_df)
final_df = initial_df.assign(fips = initial_df['county'].map(dict(zip(*intermediate_df.values()))))
或者:
initial_df = pd.DataFrame(initial_df)
final_df = initial_df.assign(fips = initial_df['county'].map(pd.DataFrame(intermediate_df).set_index('county')['fips']))
两者均导致:
>>> final_df
county values fips
0 REAGAN 508 48383
1 UPTON 364 48461
2 HARDEMAN 26 47069
3 UPTON 870 48461
答案 2 :(得分:1)
您可以从intermediate_df
中提取字典,然后将其转换为以县fips
为值键入县名的字典。然后,将其用于map
中的county
字段中的initial_df
。
mapping = {k: v for k, v in zip(*intermediate_df.values())}
df_final = pd.DataFrame(initial_df)
df_final['fips'] = df_final['county'].map(mapping)
>>> df_final
county values fips
0 REAGAN 508 48383
1 UPTON 364 48461
2 HARDEMAN 26 47069
3 UPTON 870 48461