有点卡住了。该计划应该打开一个网站,并在文件中读取保存它。然后假定将所有内容全部读取直到找到一个字符串,然后删除之前的所有内容并将其再次保存在新文件中。但是,当我运行它,我得到的HTML,我试图让原来是空白的第二个文件的第一个文件。有人能指出我正确的方向吗?
import fileinput
import re
import requests
import sys
#linkToGet=sys.argv[1] //Hvordan hente link fra terminalen
#r = requests.get(linkToGet)
#nameOfFile=sys.argv[2]
#Hent nettsiden og lagre kildekoden som en textfil
r = requests.get('https://www.bibel.no/Nettbibelen?query=ud8MMrJeKwHNJdqN05oJoRgo89+A24MHmKzQYWJRSygk2+FVqgPK3UvcYb+xB3j7') #Bare sånn jeg kan builde enkelt fra Atom
print (r.text)
f= open("kap3.txt","w+")
f.write(r.text)
f.close
#Fjern all tekst frem til en linje
TAG = """<A HREF="/Nettbibelen?query=ud8MMrJeKwHNJdqN05oJoc7CfBH5MjZKa4lw+sXwPrCzmbEZmCUXfQz2ApCFmHAq" class='versechapter'>50</A> """
tag_found = False
with open('kap3.txt') as in_file:
with open('kap3ren.txt', 'w') as out_file:
for line in in_file:
if not tag_found:
if line.strip() == TAG:
tag_found = True
else:
out_file.write(line)
答案 0 :(得分:1)
它看起来像你只叫out_file.write(line)
如果你发现你正在寻找的线,你的其他的语句应缩进成为内如果。
for line in in_file:
if not tag_found:
if line.strip() == TAG:
tag_found = True
else:
out_file.write(line)
当然,这会使外部基本无用,因此可以简化为:
for line in in_file:
if line.strip() == TAG:
# you're done here so you can break the loop
break
else:
out_file.write(line)