f.readline与f.read打印输出

时间:2017-07-24 12:28:34

标签: python parsing readfile

我是Python新手(使用Python 3.6)。我有一个read.txt文件,其中包含有关公司的信息。该文件以不同的报告特征开头

some_small_coef

我试图提取两个日期(['20120928','20121128'])以及文本中的一些字符串(即如果字符串存在,那么我想要'1')。最终,我想要一个向量给我两个日期+不同字符串的1和0,即:['20120928','20121128','1','0']。我的代码如下:

CONFORMED PERIOD REPORT:             20120928 #this is 1 line
DATE OF REPORT:                      20121128 #this is another line

and then starts all the text about the firm..... #lots of lines here

如果我运行此代码,我获得['1','0'],省略日期并给出正确的文件读取,var1存在(ok'1')而var2不存在(ok'0') 。我不明白的是为什么它不报告日期。重要的是,当我将line2更改为“line2 = f.readline()”时,我获得['20120928','20121128','0','0']。好了现在的日期,但我知道var1存在,它似乎不读取文件的其余部分?如果我省略“line2 = f.read()”,它会为每一行吐出一个0的向量,除了我想要的输出。我怎么能省略这些0?

我想要的输出是:['20120928','20121128','1','0']

抱歉打扰。还是非常感谢!

3 个答案:

答案 0 :(得分:3)

f.read()会将整个文件读入变量line2。如果你想逐行阅读,你可以一起跳过f.read()并按照这样的方式迭代

with open('read.txt', 'r') as f:
    for line in f:

除非另有说明,否则.read()进入line2之后,f无法读取更多文字,因为它全部包含在line2变量中。

答案 1 :(得分:0)

line2 = f.read()整个文件读入line2,因此您的for line in f:循环无需阅读。

答案 2 :(得分:0)

我经历过的方式终于如下:

exemptions = [] #vector I want

with open('read.txt', 'r') as f:
    line2 = "" # create an empty string variable out of the "for line" loop
    for line in f:
        line2 = line2 + line #append each line to the above created empty string
        if "CONFORMED PERIOD REPORT" in line:
            exemptions.append(line.strip('\n').replace("CONFORMED PERIOD REPORT:\t", ""))  # add line without stating CONFORMED PERIOD REPORT, just with the date)
        elif "DATE OF REPORT" in line:
            exemptions.append(line.rstrip('\n').replace("DATE OF REPORT:\t", "")) # idem above

    var1 = re.findall("string1", line2, re.I)  # find string1 in line2, case-insensitive
    if len(var1) > 0:  # if the string appears, it will have length>0
        exemptions.append('1')
    else:
        exemptions.append('0')
    var2 = re.findall("string2", line2, re.I)
    if len(var2) > 0:
        exemptions.append('1')
    else:
        exemptions.append('0')

print(exemptions)

到目前为止,这就是我所得到的。虽然我认为使用beautifulsoup可以提高代码的效率,但它对我有用。下一步:)