我试图从网站上获取信息,逐行读取,只读取以两位数开头的行,分号,两位数分号和两位数(即00:00: 00)。匹配项将导出到另一个文件。
我的正则表达式中的分号出现语法错误。
#!/usr/bin/python
import urllib2
import re
#imported urllib to collect the data. imported re for regular expressions to test format.
#creating our output file
f=open("output.txt", "r+")
#opening a file like object using urllib
webpage= urllib2.open("https://code.wireshark.org/review/gitweb?p=wireshark.git;a=blob_plain;f=manuf")
#string used to store the output
str=""
#string used to store current line
temp=""
#add while loop to read in that data. line by line.
temp=webpage.readline()
if temp.re.search([0-9][0-9]:[0-9][0-9]:[0-9][0-9]):
str.concat(temp)
temp=""
答案 0 :(得分:2)
您正在使用原始代码进行搜索,尝试输入字符串
if temp.re.search("[0-9][0-9]:[0-9][0-9]:[0-9][0-9]"):