如何直接从互联网上提取网页的标题,标题?
答案 0 :(得分:0)
步骤1 - 使用WebRequest从您要从中提取信息的网页获取WebResponse。
第2步 - 您将最终得到一个基本上是字符串的代表HTML或XHTML网页的内容,因此您需要删除所需的位
如果您对上述任一步骤有任何疑问,请确保您的问题包含有关该问题的大量详细信息。
答案 1 :(得分:0)
我会使用正则表达式来解析<title>.*?</title>
的页面HTML。
我不知道你怎么会得到“标题”。你需要一些关于标题看起来像什么的规则。
如果只是head
标记,您可以使用上述标题方法来获取该标记。
答案 2 :(得分:0)
您可以使用正则表达式和WebRequest / WebResponse类的组合来完成此操作。对于任何网络抓取需求,我强烈建议使用Simon Mourier的Html Agility Pack,它更能容忍'坏'HTML,并且还允许您将DOM作为正确的XML树进行遍历。