使用CGPDFDocumentGetCatalog和CGPDFPage的Pdf内容变得越来越复杂

时间:2016-02-21 19:24:44

标签: objective-c swift file pdf

我想获取PDF文件中的内容类型。然后读取内容并将所有文本内容转换为字符串。到目前为止,我知道我可以使用 CGPDFDocumentGetCatalog 获取内容的类型。我也知道 CGPDFDocumentGetCatalog 会返回 CGPDFDictionaryRef 。我不知道的是如何访问字典的内容,因为我不知道密钥名称。这是我的代码:

    var myDoc: CGPDFDocument!

    myDoc = CGPDFDocumentCreateWithURL(url)
    if pdfDoc != nil {
    let pdfCatalog=CGPDFDocumentGetCatalog(myDoc)

    //here I want to get the types of the content. something like pdfCatalog["type"]         
    }

由于我无法获得内容的类型,所以我决定选择仅包含文本的简单pdf。

我可以使用 CGPDFDocumentGetPage 获取页面。但是,我无法将页面的内容转换为字符串。到目前为止,这就是我所拥有的。

  let numOfPages = CGPDFDocumentGetNumberOfPages (myDoc)
        for (k = 0; k < numOfPages; k!++) {
           var myPage = CGPDFDocumentGetPage (myDoc, k! + 1 );
            var myContentStream = CGPDFContentStreamCreateWithPage (myPage);

        }

显然这是获取PDF文档,但我无法真正访问它。 CGPDFDocumentGetPage 返回 CGPDFPage ,我无法访问其内容。 CGPDFContentStreamCreateWithPage 函数返回 CGPDFContentStreamRef ,我无法从中检索内容。

请问我该怎么办呢。我需要阅读什么。

0 个答案:

没有答案