我的问题是如何在不同数据帧中的变量之间进行模式匹配。让我们说:
Df1$PrimaryCity<-C("Drew","Parchman","ALEXENDRIA","SAN JOSE") and
Df2$DESCRIPTION<-C("DUNKIN #XXXXXX Q35 ALEXANDRIA VA", "amazon.com/// xxx-ndnd SAN JOSE CA")
如果我们仔细观察主要城市的"ALEXENDRIA"
和"SAN JOSE"
与目标模式(描述)匹配。
Procd1:我将pmatch应用于部分匹配,但它没有给我正确的匹配。
Procd2:我在主要城市应用了一个for循环,并使用描述中的模式进行搜索它正在工作。但我的问题是小数据的问题(For循环)。现在很好。我需要处理700亿条记录的大数据。除了for循环之外,还有其他任何有效的方法。