使用python在文件中搜索关键字

时间:2014-06-26 16:25:57

标签: python search pdf

我如何搜索" / Count 1" ,并打印数字如下/计数。这是1 这是文件结构的一部分

 <</Type/Pages/Kids[4 0 R]/Count 1>>endobj

我写了这段代码,但在这种情况下,它打印0而不是1:

data = file(f,"rb")
rxcountpages = re.compile("/Count \d*", re.MULTILINE|re.DOTALL)
x = rxcountpages.search(data.read())
print x.group()

问题在哪里

2 个答案:

答案 0 :(得分:0)

也许您可以尝试以其他模式打开文件

data = file(f,"r")

(不含b

而且要得到正确的数字你应该使用这个正则表达式:

/Count (\d*)

然后打印

x.group(1)

所有这些看起来都像这样:

data = file(f,"r")
rxcountpages = re.compile("/Count \d*", re.MULTILINE|re.DOTALL)
x = rxcountpages.search(data.read())
print x.group(1)

答案 1 :(得分:0)

s = "<</Type/Pages/Kids[4 0 R]/Count 1>>endobj/Count 5"

print re.findall("(Count \d+)",s) # Count followed by  1 or more digits
['Count 1', 'Count 5']
相关问题