来自HTML

时间:2016-10-01 01:39:35

标签: c# html

http://api.gamebanana.com/Core/Item/Data?itemtype=Blog&itemid=18235&fields=text

我的目标是从此网页中获取文本并将其放入包含HTML中定义的换行符的字符串中。然后将该文本放入文本框中以便在表单上显示。我当前的问题是我无法将文本转换为具有HTML中的换行符的字符串。我正在使用带有C#的HTMLAgilityPack。什么是最好的方法呢?

注意:最好我可以忽略列表项(li)格式化。

当前字符串结果:今天的一系列更新:重构事件和会议,它们现在共享相似的逻辑。事件现在有持续时间和重复类型。添加即将发生的事件到BananaAds.Re-添加持久性header.Modboy improvements.Added奖投票广播。替代todolist图标而不是label.More明天!

1 个答案:

答案 0 :(得分:0)

好的,换句话说,你只需要从HTML标签中删除字符串。请参考this其他SO问题,他们举例说明了这一点。此外,在this其他人,他们使用正则表达式。 (可能更简单,更短)。

public static string StripHTML(string input)
{
   return Regex.Replace(input, "<.*?>", String.Empty);
}