我想问一个有关大规模创建新类别的问题。
我正在使用NYPD投诉数据进行数据清理,我想为每个犯罪事件(行)分配一种新型犯罪。我计划将独特类型的犯罪数量从最初的59种减少到只有20种,我会根据自己的理解(例如,将“攻击2”和“进攻”纳入“攻击”)。我正在考虑使用字典映射到数据框中的新列,但由于无法将多个值分配给一个新值(例如,我不确定是否可以使用像这样的字典{'Assault':('Assault 2','Offense')}或列表方法)
我的问题是完成这项工作的最有效和最pythonic的方法是什么? ps。您可以在以下站点上找到数据:https://data.cityofnewyork.us/Public-Safety/NYPD-Complaint-Data-Current-Year-To-Date-/5uac-w243
谢谢!