我试图使用Kimonolabs从网站上搜取一段文字。使用高级设置成功删除文本:
div > div > ul > li.location > span.value
使用此CSS选择器抓取的文本是:
Cityname, streetname 1
但是,我希望删除逗号之前的所有内容,以便只保留:
Cityname
我希望用正则表达式做到这一点,但我完全不了解它。我所做的就是使用Kimonolabs时必须包含3个街区:https://help.kimonolabs.com/hc/en-us/articles/203043464-Manually-input-regular-expressions
有人可以帮我设置正确的正则表达式吗?到目前为止我得到的只是以下内容,但它并不是Kimonolabs的正确标记(它不允许在仪表板中使用它):
^(.+?),
答案 0 :(得分:0)
请参阅您提到的文档:
和服中的正则表达式模式分为三个部分。 非常重要的是,您制作的任何自定义正则表达式都会保留三部分符号,每个部分的周围
( )
。 第一部分指的是所需内容左侧的模式。 中间部分指的是所需内容必须匹配的模式,第三部分指的是所需内容右侧的模式。
所以,你似乎需要:
/^()([^,]+)()/
或者,/(^)([^,]+)(,)/
(它应该是等效的),第二个捕获组(中间部分)应该捕获Cityname
。