我被困住了。我有一个XML文件,在FILE节点下嵌入了一个PDF文件。如何解压缩文件?我一无所有。我可以轻松获取“普通”节点的值,但是如何将文本提取到二进制PDF文件中?
这是我XML中有趣的部分:
...
<FILES>
<FILE datasetclassification="Not Defined" datasetdescription="" datasettype="PDF" datasetname="BG01119588_A_PDF_2" name="BG01119588_A_PDF_2.pdf">
JVBERi0xLjcKJeTjz9IKNiAwIG9iago8PC9MZW5ndGggNyAwIFIvRmlsdGVyL0Zs YXRlRGVjb2RlPj4Kc3RyZWFtCnicAwAAAAABCmVuZHN0cmVhbQplbmRvYmoKNyAw IG9iago4CmVuZG9iago4IDAgb2JqCjw8L1N1YnR5cGUvSW1hZ2UvV2lkdGggNDg1 L0hlaWdodCAxNzcvQml0c1BlckNvbXBvbmVudCA4L0NvbG9yU3BhY2UvRGV2aWNl
...
我想从XML中提取PDF。