如何在Android中使用MuPDF从pdf文档中提取文本

时间:2014-08-21 15:11:27

标签: android pdf mupdf

我正在尝试使用Android平台中的MuPDF库从PDF文件中提取文本。

是否可以在由坐标(左,上,右,下)指定的矩形中提取文本?

注意:我没有从源代码编译库。我使用的编译库分布在https://github.com/libreliodev/android

2 个答案:

答案 0 :(得分:1)

是的,是的 这是你可以做的。

1.GeneratedText活动

public class GeneratedText extends Activity {

private Button close;
private Button clear;
private TextView tv;
private String data;
String text = "";
Intent i;
Context mContext;
  //    MuPDFPageView pdfview = new MuPDFPageView(mContext, null, null);
    private EditText edit;
private Button undo;
public static GeneratedText screen;


@Override
protected void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.activity_generated_text);

    close = (Button)findViewById(R.id.close);
    clear = (Button)findViewById(R.id.clear);
    tv = (TextView)findViewById(R.id.text1);
    edit = (EditText)findViewById(R.id.edit);
    undo = (Button)findViewById(R.id.undo);
    undo.setEnabled(false);

    i = getIntent();

    data = i.getStringExtra("data");


    tv.setText(data);
    String mypattern = "Name and address of the Employee \n";

    Pattern p = Pattern.compile(mypattern,Pattern.DOTALL);
    if(data.matches(mypattern))
    {
        System.out.println("Start Printing name");
    }
    else
        //do nothing

    edit.setText(data);
    System.out.println("hello user "+"/n"+"user1"+ "\n"+ "user2");

    SharedPreferences pref = getSharedPreferences("key", 0);
    SharedPreferences.Editor editor = pref.edit();
    editor.putString("text", data);
    editor.commit();


    clear.setOnClickListener(new OnClickListener() {

        @Override
        public void onClick(View v) {
            // TODO Auto-generated method stub
            tv.setText("");
            edit.setText("");
            undo.setEnabled(true);
        }
    });
    close.setOnClickListener(new OnClickListener() {

        @Override
        public void onClick(View v) {
            // TODO Auto-generated method stub
            finish();
        }
    });
    undo.setOnClickListener(new OnClickListener() {

        @Override
        public void onClick(View v) {
            // TODO Auto-generated method stub
             String value = "";
            SharedPreferences pref = getSharedPreferences("key", 0);
            value = pref.getString("text", value);
            edit.setText(value);
            tv.setText(value);
            undo.setEnabled(false); 
        }
    });

}
}

1。现在在mupdfactivity写这个

public void Showtext( )
{
    destroyAlertWaiter();
    core.stopAlerts();

    MuPDFPageView pdfview = new MuPDFPageView(MuPDFActivity.this, core, null);
    String data = "";
    pdfview.setFocusable(true);
    data = pdfview.getSelectedText();
    Intent i = new Intent(getApplicationContext(),GeneratedText.class);
    i.putExtra("data",data);

    startActivity(i); 

}

在OnAcceptButtonClick中调用Showtext

你会收到你的短信。

答案 1 :(得分:0)

是的,可以借助MuPDF库从PDF文档中提取文本。在mupdf.c中有一个名为text()的方法,它在MuPDFCore.java中定义,它返回页面的文本。您需要通过页面方式调用该方法。 脚步: 1. gotopage(pagenumber) 2. text()