我需要解析大量使用HTML字体标记进行格式化的文本,
例如:
<font face="fontname" ...>Some text</font>
具体来说,我需要确定使用文本中使用的每种字体呈现哪些字符。我需要能够处理其他字体标记内的字体标记等内容。
我需要使用C#。是否有某种C#解析器类使这更容易?或者我必须自己写吗?
谢谢!
答案 0 :(得分:3)
我没有使用它,但我已经看到了HTML Agility Pack经常提到的这类事情。
答案 1 :(得分:0)
不确定这是否适用于您的情况,因为我不知道预期用途是什么,但是使用XSLT tempaltes呢?
答案 2 :(得分:0)
您可以将HTML加载到Internet Explorer中,然后在DOM中查询字体标记(或CSS样式)。
不知道这是否是明智的选择。