正则表达式代码解析:如何搜索"任何"在搜索字符串

时间:2017-07-31 14:45:58

标签: html regex parsing

我需要从这样的代码中获取几个名称(在本例中为#34; Abbi Glines"):(每次与href部分中的url相同时代码相同)

<span class="a-size-small a-color-secondary">by </span><span class="a-size-small a-color-secondary"><a href="/Abbi-Glines/e/B0057RWP90/ref=sr_ntt_srch_lnk_4?qid=1501506383&amp;sr=1-4" class="a-link-normal a-text-normal">Abbi Glines</a></span>

这是我到目前为止用正则表达式尝试的内容:

(?<=by\ </span><span\ class="a-size-small\ a-color-secondary"><a(.*?)">).*?\w(?=</a></span>)

然而,我得到了太多无关紧要的比赛。

我如何缩小范围以找到人员?代码中的名字?每个类部分之前的URL每次都不同,所以我无法通过它进行搜索。这就是为什么我尝试(。*?)的原因。

我尝试使用代码的最后部分解析名称,但是有太多其他不相关的匹配。

基本上,我怎么说搜索字符串的一部分匹配任何内容的字符串?

1 个答案:

答案 0 :(得分:0)

基于comment,使用

href="/([^/]+)

匹配,

  • href =“/字面意思
  • [^ /] +将匹配所有内容,直到下一个/

您将在第一个捕获组中获得该名称。