如何使用熊猫以矢量化方式进行邮政编码匹配?

时间:2018-10-08 03:16:56

标签: python pandas

我有一系列包含邮政编码的

zip_codes = pd.Series(['10001', '1020', '98068'])

现在,我必须将其与包含所有美国邮政编码的主表进行比较,并创建一个布尔序列,说明是否找到匹配项。

zip_master = pd.DataFrame([['98292', 'Lake Ketchum'], ['98068', 'Roslyn'], ['99013', 99013]], columns=['Zip Code', 'City Name'])

是否有矢量化方法可以做到这一点?我研究了串联字符串方法here,但无法确定它是否适合使用。

编辑1:根据注释-我们可以使用数据框方法isin

所以我最初的主要问题得到了回答。 我想进一步扩大这个问题。是否可以矢量化方式进行部分字符串匹配。假设我有一个包含城市名称的系列,我想将其与zip master的城市名称进行匹配。 ?我已经看到像here这样使用字符串匹配-但是它没有向量化。有没有有效的矢量化方法

我是否应该使用其他技术(例如缓存或数据库)来完成此任务?

0 个答案:

没有答案