我需要从URL中提取一个或多个特定单词

时间:2015-05-07 19:00:10

标签: url google-sheets extract

如何从网址中提取特定字词以显示在Google电子表格的其他列中?网址为https://seatgeek.com/bands/katy-perry?p=3,我必须从此网址中提取“katy perry”。我还必须创建第二个公式,该公式将显示相同的网址,其中包含电子表格中其他列的日期。

3 个答案:

答案 0 :(得分:1)

查找VBA的正则表达式。这样,您就可以灵活地执行模式匹配。

下面:

http://www.macrostash.com/2011/10/08/simple-regular-expression-tutorial-for-excel-vba/

或者更好,在这里:

How to use Regular Expressions (Regex) in Microsoft Excel both in-cell and loops

答案 1 :(得分:1)

这是怎么做的 - 根据需要更改A3以使Cell与URL匹配: =SUBSTITUTE(MID(A3,SEARCH(";",SUBSTITUTE(A3,"/",";",4))+1,FIND("?",SUBSTITUTE(A3,"/",";",4))-SEARCH(";",SUBSTITUTE(A3,"/",";",4))-1),"-"," ")

这样做是为了切换' /'就在凯蒂佩里之前#39;具有独特的(对于那个细胞)标记,分号。然后,使用MID(),在替换的&#39 ;;'之间提取信息。和'?'。

编辑:这应该适用于任何名称长度(即' katy-perry' katyyyyyy-peeerrryyy')。请注意,它假设您总是会有一个包含四个' /'在艺术家的名字之前。

答案 2 :(得分:0)

您提供的单个示例网址会让您想知道配置是否会成为您列出的许多其他网址的标准配置。如果这是构建其他URL的典型方式,则可以识别问号和最后一个正斜杠以解析 katy-perry 。这是完整的步骤。

以下说明假设 https://seatgeek.com/bands/katy-perry?p=3 位于A1。

  1. 在网址中附加一个问号,以防万一网址中没有一个问题,并使用找到的第一个问号剥去任何正确的问号。
    =LEFT(A1, FIND("?", A1&"?")-1)
  2. 用99个空格替换所有正斜杠。
    =SUBSTITUTE(LEFT(A1, FIND("?", A1&"?")-1), "/", REPT(" ", 99))
  3. 剥去最右边的99个字符并修剪掉额外的空格。
    =TRIM(RIGHT(SUBSTITUTE(LEFT(A1, FIND("?", A1&"?")-1), "/", REPT(" ", 99)), 99))
  4. 结果应 katy-perry 。这个公式是Google-Spreadsheet友好的。

    Parse text from Google-Sheet