获取HTML文档的子部分

时间:2009-12-11 16:53:19

标签: c# asp.net html

我正在尝试获取HTML页面的子部分。我正在寻找的功能类似于大多数博客上实现的功能。通常,在博客的主页上,您只能看到帖子的一部分,当您点击标题时,您将获得该博客帖子的完整内容。 必须有代码才能在不破坏HTML的情况下获取该子部分。

有没有人知道这样做的好.NET代码?

编辑:我需要保留内容的HTML格式,因此剥离所有HTML并不是一个真正的选择。我不介意采用内容的固定长度子字符串(即前800个字符左右),但不打破HTML将是一场噩梦。

谢谢!

5 个答案:

答案 0 :(得分:3)

我会先从内容字符串(How can I strip HTML tags from a string in ASP.NET?)中删除html,然后对结果字符串执行left

答案 1 :(得分:1)

通常,这可以通过在博客帖子呈现为html之前获取该博客文章内容的子字符串来实现。

答案 2 :(得分:1)

不能通过直接剪切页面输出(弄乱HTML)来完成。

使用显示博客内容修剪的服务器端代码处理。

答案 3 :(得分:0)

通常,完成的方式不是通过分割HTML的一部分。相反,有一个包含博客文章的数据库,Main页面有自己的HTML / CSS,它只动态加载每篇博文的前X段。

答案 4 :(得分:0)

在我看来,“可能最有效的事情”就是扫描你想要总结的博客文章,直到你到达第一个关闭段</p>标签。

不要被scan the HTML with a regex诱惑。