使用PL / SQL读取pdf或word文件

时间:2015-07-22 10:36:34

标签: sql database oracle pdf plsql

无论如何使用PL / SQL读取.pdf或.docx文件。我想读取存储在硬盘中的.pdf或.docx文件,并希望从文件中提取一些信息。例如,我有一个包含我的姓名和电子邮件地址的文件以及.pdf或.docx格式的其他信息我想读取文件并从中提取名称和电子邮件并将其存储到数据库中。在这种情况下,我知道我的姓名和电子邮件地址,但实际上我不知道这些信息。 请有人帮助我。

我阅读文章,我发现CTX_DOC很有用,但我不知道如何将其用于我的目的。

*注意:所有这些都使用PL / SQL。

任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:0)

Docx是zip存档。将其解压缩到某处,获取xml内容并在xmltype和XPath的帮助下解析它。

答案 1 :(得分:0)

我会将Oracle Text用于此