我希望将我的正则表达式与HTML字符串相匹配,该字符串可能包含前面的标题。字符串的模式将是这样的:
This Is the Title Using Title Case <br/> This is the rest of the sentences using regular sentence case.
我想在开始时抓住标题,但是我在分析包含在其中的小写文章和共轭时遇到了麻烦。我设法找到了一些有用的纯标题案例代码:
([A-Z][\w-]*(?:\s+[A-Z][\w-]*)+ <br/>)
但我不知道如何构建它以包含小写版本:
(a|an|the|and|but|or|on|in|with)