我在Android平台上使用MuPDF lib。我想从pdf文件中提取文本。我从Github得到了一个示例,它通常显示pdf文件。
那么,是否可以使用MuPDF从pdf中提取文本并复制文本?
答案 0 :(得分:0)
是的,您可以从PDF中提取文本。
如果您获得了库样本,则可以在MuPDFPageView.java中看到以下代码
@Override
protected TextWord[][] getText() {
return mCore.textLines(mPageNumber);
}
这将通过页码从PDF中提取文本。
请参阅以下方法的用法,您将了解选择和复制文本的工作原理
@TargetApi(11)
public boolean copySelection() {
final StringBuilder text = new StringBuilder();
processSelectedText(new TextProcessor() {
StringBuilder line;
public void onStartLine() {
line = new StringBuilder();
}
public void onWord(TextWord word) {
if (line.length() > 0)
line.append(' ');
line.append(word.w);
}
public void onEndLine() {
if (text.length() > 0)
text.append('\n');
text.append(line);
}
});
if (text.length() == 0)
return false;
int currentApiVersion = Build.VERSION.SDK_INT;
if (currentApiVersion >= Build.VERSION_CODES.HONEYCOMB) {
android.content.ClipboardManager cm = (android.content.ClipboardManager)mContext.getSystemService(Context.CLIPBOARD_SERVICE);
cm.setPrimaryClip(ClipData.newPlainText("MuPDF", text));
} else {
android.text.ClipboardManager cm = (android.text.ClipboardManager)mContext.getSystemService(Context.CLIPBOARD_SERVICE);
cm.setText(text);
}
deselectText();
return true;
}