如何编写正则表达式以检查字符串是否包含任何关键字

时间:2016-12-15 08:40:45

标签: java regex

我需要检查我的html文件的每一行是否包含js / css / jpg文件。如果是这样,我将在这些方面做更多的事情。 例如:

<img src="logo.jpg" />
<script src="head.js"></script> //double quotes
<script src='head.js'></script> //single quote
<link rel="stylesheet" type="text/css" href="mystyle.css">

这些都是检查规则的所有情况。 但<script src="head.json"></script>将无法匹配,因为它与关键字“js”不完全匹配。

我正在编写一个Java应用程序来扫描html源代码,并希望为检查设计一个正则表达式。基本上我认为需要检查每行是否包含.js“/',。css”/'和.jpg“/”。

将来可能会添加更多关键字。如何优雅地写正则表达式?

1 个答案:

答案 0 :(得分:1)

这仅仅是对这个问题的回答: 如何匹配js但不匹配json

您可以使用字边界:

\b(js|jpg|css)\b # or
\.(js|jpg|css)\b

Example此处。

如果要使用Java解析HTML,请使用jsoup