C#HTML字体标记解析

时间:2008-10-23 02:54:04

标签: c# parsing

我需要解析大量使用HTML字体标记进行格式化的文本,

例如:

<font face="fontname" ...>Some text</font>

具体来说,我需要确定使用文本中使用的每种字体呈现哪些字符。我需要能够处理其他字体标记内的字体标记等内容。

我需要使用C#。是否有某种C#解析器类使这更容易?或者我必须自己写吗?

谢谢!

3 个答案:

答案 0 :(得分:3)

我没有使用它,但我已经看到了HTML Agility Pack经常提到的这类事情。

答案 1 :(得分:0)

不确定这是否适用于您的情况,因为我不知道预期用途是什么,但是使用XSLT tempaltes呢?

答案 2 :(得分:0)

您可以将HTML加载到Internet Explorer中,然后在DOM中查询字体标记(或CSS样式)。

不知道这是否是明智的选择。