如何将字符串的第一部分与两个相同的子字符串匹配?

时间:2018-08-28 07:08:59

标签: python regex

我的文字如下,

[{
  "id": "A",
  "name": "firstName",
  "path": "firstPath",
  "parentId": "0"
},
{
  "id": "A_B",
  "name": "secondName",
  "path": "secondPath",
  "parentId": "A"
},
{
  "id": "A_B_C",
  "name": "thirdName",
  "path": "thirdPath",
  "parentId": "A_B"
}]

我用<meta name="description" content="28日からは「天地始粛(てんちはじめてさむし)」。 「粛」にはおさまる、弱まる等の意味があり、夏の暑さもようやく落ち着いてくる頃とされています。"> <meta name="Keywords" content="天気,天気予報,気象,情報,台風,地震,津波,週間,ウェザー,ウェザーニュース,ウェザーニューズ,今日の天気,明日の天気"><meta property="og:type" content="article"> <meta property="og:title" content="【天地始粛】音や景色から感じる秋の気配"><meta property="og:description" content="28日からは「天地始粛(てんちはじめてさむし)」。 「粛」にはおさまる、弱まる等の意味があり、夏の暑さもようやく落ち着いてくる頃とされています。"><meta property="og:url" content="https://weathernews.jp/s/topics/201807/300285/"> <meta property="og:image" content="https://smtgvs.weathernews.jp/s/topics/img/201807/201807300285_sns_img_A.jpg?1532940869"> <meta name="twitter:title" content="【天地始粛】音や景色から感じる秋の気配"> <meta name="twitter:description" content="28日からは「天地始粛(てんちはじめてさむし)」。 「粛」にはおさまる、弱まる等の意味があり、夏の暑さもようやく落ち着いてくる頃とされています。"><meta name="twitter:image" content="https://smtgvs.weathernews.jp/s/topics/img/201807/201807300285_sns_img_A.jpg?1532940869"> <link rel="canonical" href="https://weathernews.jp/s/topics/201807/300285/"> <link rel="amphtml" href="https://weathernews.jp/s/topics/201807/300285/amp.html"> <script async="async" src="https://www.googletagservices.com/tag/js/gpt.js"> 来匹配它,我想得到pattern = re.compile(r'(https://smtgvs.weathernews.jp/s/topics/img/[0-9]+/.+)\?[0-9]+'),但是我得到了

https://smtgvs.weathernews.jp/s/topics/img/201807/201807300285_sns_img_A.jpg

如何修改我的Regex模式?

1 个答案:

答案 0 :(得分:2)

您可以尝试以下方法:

这将捕获URL,直到到达文件扩展名[包括]

(https:\/\/smtgvs\.weathernews\.jp\/s\/topics\/img\/\d+\/\w+\.[jpng]{3})

demo