正则表达式混乱 - 一定长度的标题

时间:2012-11-05 22:00:39

标签: regex

我现在已经经历了几个小时的Regex教程,我似乎无法很好地掌握它。我想要一个正则表达式语句,只有当标题特别长(1000+个字符)时才提取html标题。我已设法解决以下问题以选择整个标题:

<title>(.*?)</title>

我不知道从哪里开始添加长度部分。非常感谢任何帮助!

1 个答案:

答案 0 :(得分:6)

<title>(.{1000,})</title>

会这样做(除非标题包含换行符 - 在这种情况下,它取决于正则表达式引擎如何处理)。

这也预先假定你正在查看的字符串中只有一个<title>标记(在HTML文件中可能就是这种情况,所以你应该没问题,因为一般警告正则表达式是一个处理HTML时的脆弱工具。)