python读取文件,用条件限制行

时间:2019-09-06 19:40:29

标签: python file io readline next

说我有一个文件my_file,我想从中获取某些行,例如其中每行输出是一个列表元素。我试图了解如何控制和使用Python文件的I / O操作。

文件:

cat > my_file <<EOF
[Ignore_these] 
abc
234
[Wow]
123
321
def
[Take_rest]
ghi
jkl
EOF

说,在[哇]行之后,我想合并整数行​​(可以是任意数量的行,在这里我得到的是'123321'),而忽略其余的行,直到我从想要剩余行的地方遇到[Take_rest] ('ghi'和'jkl')-[Take_rest]始终是最后一部分。因此,结果输出为data = list('123321', 'ghi', 'jkl')。 我尝试了以下类似操作,但无法理解readline()next()(等等)的工作原理。

def is_int(s):
    try:
        int(s)
        return True
    except ValueError:
        return False


with open('my_file', 'r') as f:
    data = []
    while True:
        line = f.readline()
        if '[Wow]' in line:
            wow = ''
            while is_int(next(f)):
                wow = ''.join([wow, line])
            data.append(wow)
        if '[Take_rest]' in line:
            data.append(next(f))

        if not line:
            break

1 个答案:

答案 0 :(得分:1)

使用以下方法代替复杂的事情:

with open('input.txt') as f:
    data = ['']
    wow_flag = False
    for line in f:
        line = line.strip()
        if line.startswith('[Wow]'):   # detect `Wow` section start
            wow_flag = True
        elif line.startswith('[Take_rest]'):  # taking all the rest
            data.extend(list(line.strip() for line in f))
        if wow_flag and line.isdigit():   # capturing digits under `Wow` section
            data[-1] += line

print(data)

输出:

['123321', 'ghi', 'jkl']