从Msword文档asp.net逐字逐句阅读

时间:2011-09-26 12:01:23

标签: asp.net

我正在开发一个应用程序,我需要从上传的文档中逐字阅读。

为此,我添加了以下代码:

Microsoft.Office.Interop.Word.ApplicationClass Application = 
    new Microsoft.Office.Interop.Word.ApplicationClass();
object nullobj = System.Reflection.Missing.Value;
object file = "c:\\word.doc";
object value = System.Reflection.Missing.Value;
Microsoft.Office.Interop.Word.Document doc = 
    Application.Documents.Open(ref file,
            ref nullobj, ref nullobj, ref nullobj, 
            ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj,
            ref value,
            ref value,
            ref nullobj, ref nullobj, ref nullobj,
            ref nullobj, ref nullobj);

    doc.Activate();
    //var ss = doc.Words[0];  
    var x = doc.Words;

    foreach (var v in doc.Words)
    {

    }
    string Doc_Content = doc.Content.Text;
    // txtContent.Text = Doc_Content;
    doc.Close(ref nullobj, ref nullobj, ref nullobj);

循环正在进行文档中的每个单词,但我无法在循环中获得单词。如果有人有解决方案,请帮助我。

2 个答案:

答案 0 :(得分:1)

为此我们必须添加哪个命名空间

Microsoft.Office.Interop.Word.ApplicationClass Application = 
    new Microsoft.Office.Interop.Word.ApplicationClass();

答案 1 :(得分:0)

您可以将V转换为范围,并从中获取文本。

string ActualText = ((Range)v).Text;