我是Asp.net mvc的新手,这是我的第一个基于Web的应用程序,我将从word文件中提取文本并提取语法错误。但我不知道如何从word文件中提取文本?
答案 0 :(得分:0)
在ASP.NET中,使用Word文档的一个好方法是Open XML SDK,因为它不需要在服务器上安装单词。
您必须安装Open XML SDK并将DocumentFormat.OpenXml.dll和WindowsBase.dll的引用添加到您的项目中。 然后,您可以打开文档并阅读/替换如下文本:
using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Wordprocessing;
class WordTest
{
public static void ReplaceTextInWordDoc()
{
string filepath = "C:\\Tmp\\MyWordDoc.docx";
using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(filepath, true))
{
Body body = wordDoc.MainDocumentPart.Document.Body;
foreach (var paragraph in body.Elements<Paragraph>())
{
foreach (var run in paragraph.Elements<Run>())
{
foreach (var text in run.Elements<Text>())
{
if (text.Text.Contains("old"))
text.Text = text.Text.Replace("old", "new");
}
}
}
}
}
}