用Jython打印html标题?

时间:2014-11-09 20:42:30

标签: html jython

在jython中,有没有办法创建一个以url(html)作为参数的函数,并返回url的标题(<title></title>之间的任何内容) ?

1 个答案:

答案 0 :(得分:1)

当然是!

首先要分析的下载页面。您可以使用urllib2模块执行此操作。阅读其文档,在底部,您将找到有关如何阅读页面内容的示例。

如果您有网页内容,则必须在其中找到标题。你可以通过很多方式做到这一点。有解析HTML的模块,但是对于这么简单的任务,你可以使用正则表达式(模块re)甚至字符串函数(find()方法)。

请注意,HTML标记区分大小写,因此,如果您要使用find()方法查找标题的开头和结尾,则可能还需要lower()方法和原始页面的副本。< / p>