Question

我想解决的问题：

我想将word文档转换为HTML，并且我希望将特定文本转换为超链接。在将word文档保存为HTML之前，我无法在C＃中找到添加超链接的方法。所以，我做的工作是将文档保存为HTML，然后读取HTML文档并用超链接替换特定文本。

我不知道这是否是最好的方法，但到目前为止我没有找到任何其他选择。

现在的问题是，当我读取HTML文件时，我得到了一些特殊字符的垃圾字符。在我的Word文档中，我有“......”三个点，我认为这是一个特殊的字符，所以当我在HTML中读到我有垃圾信件时......奇怪的是，当我在记事本中打开HTML文件时它正确地显示了我。

然而，通过编码，我无法阅读这些字符。

请帮帮我。

Answer 1

听起来您可能需要查看ms word doc使用的encoding。 MS Word可能正在使用ASCIIEncoding。

还要查看执行此操作的现有c＃库。

Answer 2

我的实际问题是我想将word文档中的特定文本转换为超链接，我找不到办法。 MSDN的帮助非常可怜，并且错误浪费了我很多时间。我是自动化word文档的新手。

这就是为什么我发现在将文件转换为HTML后添加超链接很容易，但这有其自身的问题。我现在就是这样做的

Word库为您提供了查找功能，但不会告诉您找到文本的位置。

找到文本和起始位置然后

地址= doc.Range（开始，结束）.Text +“。pdf”

doc.Hyperlinks.Add（doc.Range（start，end），Address，_

                                SubAddress, ScreenTip, TextToDisplay, Target)