标签: regex web-crawler
我正在尝试从抓取的页面中提取一个电话号码(10位数字)。电话号码可以以7或8或9开头,并且为10位数字。到目前为止,我一直无法找到以7开头的数字。
7(.+?)\b
我想找到以7或8或9开头且长10位的数字。我正在尝试在Octoparse中实现正则表达式。输入字符串是网页的HTML结构。我们非常感谢您的帮助。
答案 0 :(得分:1)
可能
[7-9]\d{9}\b
是7到9之一,后跟9位数字。如果\d无法被octoparse识别,则可以使用[0-9]。
\d
[0-9]