如何使用“ USADDRESS”包创建熊猫数据框

时间:2019-06-26 14:21:38

标签: python pandas jupyter

我正在尝试使用python中的'usaddress'包创建具有地址和已解析地址的标准化pandas数据框。我希望能够将解析输出的结果存储在数据框中。

usaddress.parse的输出如下所示。

    usaddress.parse('Robie House, 5757 South Woodlawn Avenue, Chicago, IL 60637')



[('Robie', 'BuildingName'),
('House,', 'BuildingName'),
('5757', 'AddressNumber'),
('South', 'StreetNamePreDirectional'),
('Woodlawn', 'StreetName'),
('Avenue,', 'StreetNamePostType'),
('Chicago,', 'PlaceName'),
('IL', 'StateName'),
('60637', 'ZipCode')]

我在数据数据框中有我的地址字段。使用上面的示例,我尝试将建筑物名称,地址编号等添加为列名,并将相应的值添加为值,但没有运气。

add = []
for ind in data.index: 
     add1 = usaddress.Parse(data['address'][ind])
     add.append(add1)      
res = pd.DataFrame(add)

在使用上面的代码时,res数据帧不是我想要的输出方式。预期的输出是

The image shows the intened output from the dataframe

0 个答案:

没有答案