Question

我正在使用PoDoFo 0.9.1库来读取包含Win32 XP中文版操作系统中文字符的PDF文件。我发现PoDoFo的示例项目“podofotxtextract”可以优雅地阅读英文PDF，但是，当我打开中文PDF文件时，没有解析出来。有人有建议吗？非常感谢。

Answer 1

我使用Objective C在现有PDF文件上添加注释顺便说一下：试试

PdfString pdfString（reinterpret_cast＆lt; const pdf_utf8 *＆gt;（“你读的字符......”））;

下面是一些代码...

PdfPage* pPage = doc->GetPage(pageIndex);
if (! pPage) {
    // couldn't get that page 
    return;
}
PdfAnnotation* anno;

anno = pPage->CreateAnnotation(ePdfAnnotation_Text, rect);

PdfString sTitle(reinterpret_cast<const pdf_utf8*>([@"中国" UTF8String]));
PdfString sContent(reinterpret_cast<const pdf_utf8*>([@"这是一个中文测试"UTF8String]));
// to parse this annotation
// anno->GetContents().GetStringUtf8().c_str()
anno->SetTitle(sTitle);
anno->SetContents(sContent);
anno->SetOpen(bOpen);

如何使用PoDoFo的“podofotxtextract”（C ++）示例从PDF文件中读取中文文本

1 个答案: