从链接中读取数据

时间:2013-03-02 02:44:22

标签: python

我有一个wiki链接@ http://wiki.company.com/company/w/index.php?title=test&action=edit,其数据在HTML中如下所示... 有没有办法让我可以获得具有测试Combo的块?任何内置的python模块,欣赏输入

INPUT:-

=== find ===

data1

==== <font color="#008000">test Combo</font> ====

{| border="1" cellspacing="1" cellpadding="1"
|-
test
|}

==== next bloock ===

data3

OUTPUT:-
{| border="1" cellspacing="1" cellpadding="1"
|-
test
|}

1 个答案:

答案 0 :(得分:0)

首先,您需要一种方法来下载相关文件。这样做的标准python模块是urllib2。

然后你需要一种方法来处理HTML文件。适合该任务的两个好的python模块是Beautiful Souplxml