Python:在网站源代码中查找字符串的问题

时间:2010-05-06 07:01:10

标签: python

我用urlopen打开一个网站。然后我把网站的源代码放到一个像这样的变量

source = website.read()

当我只打印源时,它会正确格式化,但是当我尝试遍历每一行时,每个字符都是它自己的行。

例如

当我打印它时看起来像这样

<HTML> title</html>

当我这样做时

for line in source:
      print line

看起来像这样

<
H
T
M
L
... etc

我需要找到一个以“var”开头的字符串然后打印整行。

2 个答案:

答案 0 :(得分:5)

使用readlines()而不是read()来获取行列表。

答案 1 :(得分:1)

或使用:

for line in source.split("\n"):
    ...