通过python从网站解析信息

时间:2015-06-26 19:53:25

标签: python url

我正在尝试将网站中的数字读入变量。数字的源代码如下所示:

<tr bgcolor="#ccffff"><td>N_300_0</td><td>5918.720</td></tr>

网站将始终说N_300_0,但数字会改变。

到目前为止,我有:

link = urllib2.urlopen("http://www.example.com").read()
matches = re.findall('N_300_0', link);
number = ....

如何将数字输入变量?

1 个答案:

答案 0 :(得分:0)

如果您正在进行任何严肃或相关的抓取,我会非常同意BeautifulSoup之类的东西是更好的方法。

但是要回答你的问题,你需要通过parens在python正则表达式中使用grouping进行你想要的那种捕获,例如。

var array1 = [1, 2, 3]
var array2 = array1 // array is copied
array1[2] = 4
println(array1) // -> [1, 2, 4]
println(array2) // -> [1, 2, 3]