从HTML页面中提取可本地化的内容

时间:2011-08-17 09:46:05

标签: c#-4.0 localization

我需要一些关于我需要在我正在进行的项目中实现的功能的最佳方法的建议。

基本上,我需要能够从HTML页面中提取所有可本地化的内容(即所有字符串)。我真的不想去编写HTML解析器。该应用程序是用C#编写的。

有没有人有这方面的经验,或者有人可以推荐一个我可以用来完成这个的现有库?

感谢。

1 个答案:

答案 0 :(得分:1)

您不必编写自己的解析器。幸运的是,其他人已经这样做了 要解析HTML文件,您可以使用HTML Agility Pack

在这种情况下,您将收到文档对象模型,您可以像任何其他DOM一样行走。请找到这些例子:

http://www.4guysfromrolla.com/articles/011211-1.aspx
http://htmlagilitypack.codeplex.com/wikipage?title=Examples&referringTitle=Home

这个问题:

How to use HTML Agility pack