我有一个包含一些文字和图片的文字文件。我想提取文档的特定部分并插入SQL表中的列。
Word文档示例
House Name: House One
Townland: Townland One
如果标题“House Name”存在,我想要一些东西,取出它之后的文本,在本例中为“House One”,并将其插入表格的列中。是否有我可以用来执行此操作的库或脚本。我做了很多互联网搜索但找不到与我的问题相似的东西。
答案 0 :(得分:0)
您可以使用Microsoft PIA(主互操作程序集)或OpenXmlSDK。以下代码用于使用PIA打开Word文档和阅读所有文本(通过Visual Studio参考添加引用并选择Microsoft.Office.InterOp.Word.xx = => xx是安装的PIA版本,如14.0或15.0)
Microsoft.Office.Interop.Word.Application app = new Microsoft.Office.Interop.Word.Application();
var document=app.Documents.Open(@"C:\Users\srivastav_a\Desktop\TO WHOM SO EVER IT MAY CONCERN.docx");
var text = document.Content.Text;
//do something
app.Quit();
您可以参考以下链接 https://msdn.microsoft.com/en-us/library/aa302338.aspx https://msdn.microsoft.com/en-us/library/tcyt0y1f.aspx
的OpenXML https://msdn.microsoft.com/en-us/library/office/bb448854.aspx