我想从网站上抓取一个品牌。有时这个名字有一个我不想捕捉的额外词。例如,我想抓取Kitchen Aid
,但该网站有Kitchen Aid Appliances
。另一个示例是Maytag Appliance
- 请注意,第一个示例为Appliances
's'
,第二个Appliance
为's'
。
我有一个我认为可行的正则表达式,但事实并非如此。我不确定原因。
^(\w.+)(\sAppliances?)?$
?
应匹配's'
上的Appliance(s)
中的零个或一个。第一组应该是Appliance(s)
之前的所有单词。因此,它应该抓取Kitchen Aid
或Maytag
。
某些品牌可能未包含Appliance
或Appliances
。我可以列出GE
或Thermador
,然后抓住它。
如果不符合我的用例,我将非常感谢您对此提供的任何帮助以及对此代码所做的事情的澄清。