应用错误收集

通常，甚至不可能逐页分离本机 PDF文件的内容（当文件是base64编码时，无法这样做，正如您将看到的那样）。

PDF文件的最常规结构依次为：

您不能假设PDF对象在文件内部显示的顺序与PDF查看器中显示的内容相同。

如果您提取单个页面，则此页面本身必须是有效的PDF文档：包含（按相同顺序）标题，对象，外部参照和预告片，其中xref和预告片需要重新构建，以便它们匹配新文件（外部参照和预告片不能简单地从原始文件中复制）。

出于这个原因，您需要先解码base64编码的文件，然后才能考虑访问生成的PDF的单个页面。

要获得 - 使用base64编码的5页PDF文档 - 所有单独的PDF页面为base64，您必须按照以下步骤操作：

您可能希望澄清您的答案。根据您的措辞，您是否要在base64中进行编码或从中进行解码，这一点并不明显。

假设你要解码（因为你说你有base64），有标准库可用： Decode Base64 data in Java