如何使用PoDoFo的“podofotxtextract”(C ++)示例从PDF文件中读取中文文本

时间:2011-09-23 09:27:00

标签: c++ windows pdf podofo

我正在使用PoDoFo 0.9.1库来读取包含Win32 XP中文版操作系统中文字符的PDF文件。   我发现PoDoFo的示例项目“podofotxtextract”可以优雅地阅读英文PDF,但是,当我打开中文PDF文件时,没有解析出来。有人有建议吗?非常感谢。

1 个答案:

答案 0 :(得分:1)

我使用Objective C在现有PDF文件上添加注释 顺便说一下:试试

  

PdfString pdfString(reinterpret_cast< const pdf_utf8 *>(“你读的字符......”));

下面是一些代码...

PdfPage* pPage = doc->GetPage(pageIndex);
if (! pPage) {
    // couldn't get that page 
    return;
}
PdfAnnotation* anno;

anno = pPage->CreateAnnotation(ePdfAnnotation_Text, rect);

PdfString sTitle(reinterpret_cast<const pdf_utf8*>([@"中国" UTF8String]));
PdfString sContent(reinterpret_cast<const pdf_utf8*>([@"这是一个中文测试"UTF8String]));
// to parse this annotation
// anno->GetContents().GetStringUtf8().c_str()
anno->SetTitle(sTitle);
anno->SetContents(sContent);
anno->SetOpen(bOpen);