从“字符串”复制html代码,直到下一个“字符串”

时间:2019-08-21 09:50:41

标签: python html parsing

我尝试将HTML代码的一部分复制到文件中,从值开始直到下一个值,该如何处理,我尝试使用python完成。

这是我的代码:

import urllib2

html_code = urllib2.urlopen("web site")
html_code_list = html_code.readlines()

data = ""
for line in html_code_list:
    line = line.strip()

    if '<A NAME="table8">' in line :
      #copy the html contents in data
      #until find <!**********************************************>
      #break

1 个答案:

答案 0 :(得分:2)

尝试:

import urllib2

html_code = urllib2.urlopen("web site")
html_code_list = html_code.readlines()
cpy = False
data = ""
for line in html_code_list:
    line = line.strip()

    if '<A NAME="table8">' in line:
        cpy = True
    if '<!**********************************************>' in line:
        cpy = False
    if cpy:
        data += line