TSQL脚本提取Word文档的特定部分并插入SQL数据库表

时间:2015-04-23 10:55:51

标签: c# sql asp.net visual-studio ms-word

我有一个包含一些文字和图片的文字文件。我想提取文档的特定部分并插入SQL表中的列。

Word文档示例

House Name: House One
Townland: Townland One

如果标题“House Name”存在,我想要一些东西,取出它之后的文本,在本例中为“House One”,并将其插入表格的列中。是否有我可以用来执行此操作的库或脚本。我做了很多互联网搜索但找不到与我的问题相似的东西。

1 个答案:

答案 0 :(得分:0)

您可以使用Microsoft PIA(主互操作程序集)或OpenXmlSDK。以下代码用于使用PIA打开Word文档和阅读所有文本(通过Visual Studio参考添加引用并选择Microsoft.Office.InterOp.Word.xx = => xx是安装的PIA版本,如14.0或15.0)

Microsoft.Office.Interop.Word.Application app = new Microsoft.Office.Interop.Word.Application();
        var document=app.Documents.Open(@"C:\Users\srivastav_a\Desktop\TO WHOM SO EVER IT MAY CONCERN.docx");
        var text = document.Content.Text;

//do something
        app.Quit();

您可以参考以下链接 https://msdn.microsoft.com/en-us/library/aa302338.aspx https://msdn.microsoft.com/en-us/library/tcyt0y1f.aspx

的OpenXML https://msdn.microsoft.com/en-us/library/office/bb448854.aspx