kimonolabs>逗号前的文字

时间:2016-02-12 10:17:32

标签: regex

我试图使用Kimonolabs从网站上搜取一段文字。使用高级设置成功删除文本:

div > div > ul > li.location > span.value

使用此CSS选择器抓取的文本是:

Cityname, streetname 1

但是,我希望删除逗号之前的所有内容,以便只保留:

Cityname

我希望用正则表达式做到这一点,但我完全不了解它。我所做的就是使用Kimonolabs时必须包含3个街区:https://help.kimonolabs.com/hc/en-us/articles/203043464-Manually-input-regular-expressions

有人可以帮我设置正确的正则表达式吗?到目前为止我得到的只是以下内容,但它并不是Kimonolabs的正确标记(它不允许在仪表板中使用它):

^(.+?),

1 个答案:

答案 0 :(得分:0)

请参阅您提到的文档:

  

和服中的正则表达式模式分为三个部分。 非常重要的是,您制作的任何自定义正则表达式都会保留三部分符号,每个部分的周围( ) 第一部分指的是所需内容左侧的模式。 中间部分指的是所需内容必须匹配的模式,第三部分指的是所需内容右侧的模式。

所以,你似乎需要:

/^()([^,]+)()/

或者,/(^)([^,]+)(,)/(它应该是等效的),第二个捕获组(中间部分)应该捕获Cityname