从网址中删除部分字符串

时间:2017-10-05 14:19:29

标签: r regex dplyr

我想从给定的字符串url和反斜杠@start

中删除jsessionid
/product.screen?productId=BS-AG-G09&JSESSIONID=SD1SL6FF6ADFF6510

这样输出就像

product.screen?productId=BS-AG-G09

更多数据如:

1                      /product.screen?productId=WC-SH-A02&JSESSIONID=SD0SL6FF7ADFF4953
2                                     /oldlink?itemId=EST-6&JSESSIONID=SD0SL6FF7ADFF4953
3                       /product.screen?productId=BS-AG-G09&JSESSIONID=SD0SL6FF7ADFF4953
4                       /product.screen?productId=FS-SG-G03&JSESSIONID=SD0SL6FF7ADFF4953
5  /cart.do?action=remove&itemId=EST-11&productId=WC-SH-A01&JSESSIONID=SD0SL6FF7ADFF4953
6                                    /oldlink?itemId=EST-14&JSESSIONID=SD0SL6FF7ADFF4953
7     /cart.do?action=view&itemId=EST-6&productId=MB-AG-T01&JSESSIONID=SD1SL6FF6ADFF6510
8                       /product.screen?productId=BS-AG-G09&JSESSIONID=SD1SL6FF6ADFF6510
9                       /product.screen?productId=WC-SH-A02&JSESSIONID=SD1SL6FF6ADFF6510
10    /cart.do?action=view&itemId=EST-6&productId=WC-SH-A02&JSESSIONID=SD1SL6FF6ADFF6510
11                      /product.screen?productId=WC-SH-A02&JSESSIONID=SD1SL6FF6ADFF6510

1 个答案:

答案 0 :(得分:0)

您可以使用:

library(stringi)

lf1 = "/product.screen?productId=BS-AG-G09&JSESSIONID=SD0SL6FF7ADFF4953"

stri_replace_all_regex(
"/product.screen?productId=BS-AG-G09&JSESSIONID=SD0SL6FF7ADFF4953",
"&JSESSIONID=.*","")

字符串:& JSESSIONID =。*(直到最后。*)被替换为空(“”)。

或简单地说:gsub("&JSESSIONID=.*","",lf1)