Question

用\ s或＆＃39; \ n＆＃39;重新搜索我没有找到想要搜索的多线。

来源部分：

Date/Time:
2013-08-27 17:05:36 

----- BEGIN SEARCH -----

GENERAL DATA:
NAME:   AB12
SECTOR: 
999,999
CONTROLLED BY:  Player
ALLIANCE:   Aliance
ONLINE: 1 seconds ago
SIZE:   Large
HOMEWORLD:  NO
APPROVAL RATING:    100%
PRODUCTION RATE:    100%

RESOURCE DATA:
POWER:  0 / 0
BUILDINGS:  0 / 20
ORE:    80,000 / 80,000
CRYSTAL:    80,000 / 80,000
POPULATION: 40,000 / 40,000

BUILDING DATA:
N/A

UNIT DATA:
WYVERN(S):  100

----- END SEARCH -----

在Notepad ++中查看它，我看到＆＃34; BUILDING DATA：（LF）＆＃34;

完整代码

lines = open('scan.txt','r').readlines()
for a in lines:
    if re.search(r"\A\d", a):
        digits = a
        if re.search(r"2013", digits):
            date.append(digits[:19])
            count +=1
        elif re.search(r",", digits):
            clean = digits.rstrip()
            sector = clean.split(',')
            x.append(sector[0])
            y.append(sector[1])
    elif re.search(r"CONTROLLED BY:", a):
        player.append(a[15:].rstrip())
    elif re.search(r"ALLIANCE:", a):
        alliance.append(a[10:].rstrip())
    elif re.search(r"SIZE:", a):
        size.append(a[6:].rstrip())
    elif re.findall('BUILDING DATA:\sN/A', a, re.M):
        def_grid = ''
        print "Didn't find it"
        defense.append(def_grid)
        defense_count +=1
    elif re.search(r"DEFENSE GRID", a):
        def_grid = a[16:].rstrip()
        print "defense found"
        defense_count +=1

但我没有回来。

我需要在＃34; DEFENSE GRID＆＃34;在＆＃34;建立数据之后不存在：＆＃34;

我知道我错过了一些内容并且我已经尝试过阅读re.search但我无法找到解释多线如何运作的详细示例。

Answer 1

re.findall("BUILDING DATA:\nN/A",a,re.MULTILINE)

Answer 2

您可以使用re.findall代替re.search来完成您的工作：

re.findall('BUILDING DATA:\nN/A', a, re.M)
#['BUILDING DATA:\nN/A']

编辑：

问题在于您目前正在逐行阅读。为了检测属于两行或更多行的模式，您必须将字符串视为一个整体，可能正在执行：

s = ''.join(lines)

如果lines不是那么大，那就没关系，然后使用s执行多行搜索......

Answer 3

我想知道你为什么没有回来。如果您的文件如下所示：

BUILDING DATA:
N/A

我使用

import re
f = open('test.txt','r')
a = f.read(20)
re.search('BUILDING DATA:\nN/A', a, re.M)

输出。这是

<_sre.SRE_Match object at 0x1004fc8b8>

如果我用字符串测试re.search，那就不像在这段代码中那样在文件中：

import re
f = open('test.txt','r')
a = f.read(20)
re.search('BUILDING BATA:\nN/A', a, re.M)

没有预期的输出。

编辑：

正如Saullo Castro指出的那样，问题在于逐行阅读。为什么不使用这样的东西？

a = open('scan.txt','r').read()
if re.findall('BUILDING DATA:\nN/A', a, re.M):
     print('found!')

第3次尝试：

tmp = False
...
elif re.findall('BUILDING DATA:', a, re.M):
    tmp = True
elif tmp and re.findall('N/A', a, re.M):
    def_grid = ''
    print "Didn't find it"
    defense.append(def_grid)
    defense_count +=1

Answer 4

替换

re.findall('BUILDING DATA:\sN/A', a, re.M):

与

re.findall('BUILDING DATA:\nN/A', a, re.M):

或

re.search(r'BUILDING DATA:\nN/A', a, re.M):

它应该有用。

（请注意，在您的代码中，\s代替\n）

re.search多行Python

4 个答案: