难以仅提取URL的一部分

时间:2018-03-21 18:28:42

标签: r regex

我在向量中存储了一个URL链接:

 links <- "https://www.amazon.in/Glass-Milk-Bottle-Clear-Pieces/dp/B01J9SKYYU&sa=U&ved=0ahUKEwiGkd_x8P3ZAhUOSY8KHZUVBg0QFggmMAA&usg=AOvVaw1wAFHoDLiP94xbl9JJsp8E"

我想只提取以上网址的一部分: 即“https://www.amazon.in/Glass-Milk-Bottle-Clear-Pieces/dp/B01J9SKYYU

我想要做的是在下面的代码中,但我不能这样做..

 library(stringr)
 upattern <- "http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\\(\\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+"
 ExtractedURL <- str_extract(links[1], upattern)

我确实犯了错误?

0 个答案:

没有答案