我现在已经经历了几个小时的Regex教程,我似乎无法很好地掌握它。我想要一个正则表达式语句,只有当标题特别长(1000+个字符)时才提取html标题。我已设法解决以下问题以选择整个标题:
<title>(.*?)</title>
我不知道从哪里开始添加长度部分。非常感谢任何帮助!
答案 0 :(得分:6)
<title>(.{1000,})</title>
会这样做(除非标题包含换行符 - 在这种情况下,它取决于正则表达式引擎如何处理)。
这也预先假定你正在查看的字符串中只有一个<title>
标记(在HTML文件中可能就是这种情况,所以你应该没问题,因为一般警告正则表达式是一个处理HTML时的脆弱工具。)