我有HTML,我需要收集所有具有特定格式的内容,例如获取00.000.000/0000-00
或XX.YYY.IIO/KKKK-LL
格式的所有内容。
使用正则表达式是实现此目的的最佳方法,还是我还能如何实现这一目标呢?
答案 0 :(得分:3)
如果您正在寻找匹配的模式:
xx.xxx.xxx/xxxx-xx
其中x
只是一个字母数字字符(即a-z
,A-Z
和0-9
),那么您可以使用此模式:
[a-zA-Z0-9]{2}\.[a-zA-Z0-9]{3}\.[a-zA-Z0-9]{3}\/[a-zA-Z0-9]{4}-[a-zA-Z0-9]{2}
您可以在this example中尝试。
答案 1 :(得分:1)
尝试:
\w{2}\.\w{3}\.\w{3}\/\w{4}-\w{2}