我想从asp.net mvc中的Ms word文件中提取文本?

时间:2015-03-03 11:37:20

标签: asp.net-mvc

我是Asp.net mvc的新手,这是我的第一个基于Web的应用程序,我将从word文件中提取文本并提取语法错误。但我不知道如何从word文件中提取文本?

1 个答案:

答案 0 :(得分:0)

在ASP.NET中,使用Word文档的一个好方法是Open XML SDK,因为它不需要在服务器上安装单词。

您必须安装Open XML SDK并将DocumentFormat.OpenXml.dll和WindowsBase.dll的引用添加到您的项目中。 然后,您可以打开文档并阅读/替换如下文本:

using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Wordprocessing;

class WordTest
{
    public static void ReplaceTextInWordDoc()
    {
        string filepath = "C:\\Tmp\\MyWordDoc.docx";
        using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(filepath, true))
        {
            Body body = wordDoc.MainDocumentPart.Document.Body;
            foreach (var paragraph in body.Elements<Paragraph>())
            {
                foreach (var run in paragraph.Elements<Run>())
                {
                    foreach (var text in run.Elements<Text>())
                    {
                        if (text.Text.Contains("old"))
                            text.Text = text.Text.Replace("old", "new");
                    }
                }
            }
        }
    }
}