pandas-根据字典值修改列值

时间:2019-02-08 05:42:15

标签: python excel pandas

我有一个CSV文件,其中包含“州”列,其中包含完整的美国州名称,例如:“新泽西州”,“加利福尼亚州”等。 我想修改此列,以便它们包含缩写而不是全名,例如“ NJ”,“ CA” ...

为此,我已经有一个字典,将状态名称映射为其缩写

us_state_abbrev = {
'Alabama': 'AL', 'Alaska': 'AK', 'Arizona': 'AZ', 'Arkansas': 'AR', 'California': 'CA', 'Colorado': 'CO',
'Connecticut': 'CT', 'Delaware': 'DE', 'Florida': 'FL', 'Georgia': 'GA', 'Hawaii': 'HI', 'Idaho': 'ID',
'Illinois': 'IL', 'Indiana': 'IN', 'Iowa': 'IA', 'Kansas': 'KS', 'Kentucky': 'KY', 'Louisiana': 'LA',
'Maine': 'ME', 'Maryland': 'MD', 'Massachusetts': 'MA', 'Michigan': 'MI', 'Minnesota': 'MN', 'Mississippi': 'MS',
'Missouri': 'MO', 'Montana': 'MT', 'Nebraska': 'NE', 'Nevada': 'NV', 'New Hampshire': 'NH', 'New Jersey': 'NJ',
'New Mexico': 'NM', 'New York': 'NY', 'North Carolina': 'NC', 'North Dakota': 'ND', 'Ohio': 'OH', 'Oklahoma': 'OK',
'Oregon': 'OR', 'Pennsylvania': 'PA', 'Rhode Island': 'RI', 'South Carolina': 'SC', 'South Dakota': 'SD',
'Tennessee': 'TN', 'Texas': 'TX', 'Utah': 'UT', 'Vermont': 'VT', 'Virginia': 'VA', 'Washington': 'WA',
'West Virginia': 'WV', 'Wisconsin': 'WI', 'Wyoming': 'WY'}

如何遍历CSV文件和字典中的列,并用缩写替换完整的州名?

这是我写的代码,但是不起作用:

with open(emp_file, 'r', errors='ignore') as fileHandle:
reader = csv.reader(fileHandle)
for row in reader:
    for state, abbrev in us_state_abbrev.items():
        if row[4] == state:
            row[4] = abbrev

我在这里做错了什么?请帮忙。

1 个答案:

答案 0 :(得分:4)

import pandas as pd

df = pd.read_csv(emp_file)

然后,假设您知道要编辑哪一列:

df['State'] = df['State'].map(us_state_abbrev).fillna(df['State'])

请注意:最后一部分处理的是字典中不存在的State个条目