我有一系列包含邮政编码的
zip_codes = pd.Series(['10001', '1020', '98068'])
现在,我必须将其与包含所有美国邮政编码的主表进行比较,并创建一个布尔序列,说明是否找到匹配项。
zip_master = pd.DataFrame([['98292', 'Lake Ketchum'], ['98068', 'Roslyn'], ['99013', 99013]], columns=['Zip Code', 'City Name'])
是否有矢量化方法可以做到这一点?我研究了串联字符串方法here,但无法确定它是否适合使用。
编辑1:根据注释-我们可以使用数据框方法isin
所以我最初的主要问题得到了回答。 我想进一步扩大这个问题。是否可以矢量化方式进行部分字符串匹配。假设我有一个包含城市名称的系列,我想将其与zip master的城市名称进行匹配。 ?我已经看到像here这样使用字符串匹配-但是它没有向量化。有没有有效的矢量化方法
我是否应该使用其他技术(例如缓存或数据库)来完成此任务?