从网页中提取标题

时间:2010-03-22 15:31:45

标签: asp.net

如何直接从互联网上提取网页的标题,标题?

3 个答案:

答案 0 :(得分:0)

步骤1 - 使用WebRequest从您要从中提取信息的网页获取WebResponse。

第2步 - 您将最终得到一个基本上是字符串的代表HTML或XHTML网页的内容,因此您需要删除所需的位

如果您对上述任一步骤有任何疑问,请确保您的问题包含有关该问题的大量详细信息。

答案 1 :(得分:0)

我会使用正则表达式来解析<title>.*?</title>的页面HTML。

我不知道你怎么会得到“标题”。你需要一些关于标题看起来像什么的规则。

如果只是head标记,您可以使用上述标题方法来获取该标记。

答案 2 :(得分:0)

您可以使用正则表达式和WebRequest / WebResponse类的组合来完成此操作。对于任何网络抓取需求,我强烈建议使用Simon Mourier的Html Agility Pack,它更能容忍'坏'HTML,并且还允许您将DOM作为正确的XML树进行遍历。