iText通过pdf逐字迭代

时间:2016-08-01 10:58:00

标签: java pdf itext

我想填充包含PDF中每个单词位置的数据结构。

我有一个PDF,最后我想迭代这些单词及其位置的数据结构。

以下内容: public class MyPageViewModel : ViewModelBase { private String _selectedText; public String SelectedText { get { return _selectedText; } set { if (_selectedText != value) { _selectedText = value; } } } public MyPageViewModel () { _selectedText = "Welcome"; //Default text } private async Task<string> SomeTask() { return await Task.Run(async () => { await Task.Delay(3000); //Dummy task. It will return the status of Task. return "Thanks"; //Update Text }); } }

我知道PDF中的单词毫无意义,可能会发生多个文本调用(例如&#34;你好&#34; - &gt;&#34;他&#34; +&#34; llo&#34;或&# 34;地狱&#34; +&#34; o&#34;)。为了我的目的,应该没问题。

我不在这里寻找效率,所以很奇怪的解决办法很好。我目前的想法是我可以从PDF中提取文本,然后搜索文档上每个单词的位置(我知道它的可怕效率)。我如何在pdf中找到特定单词的位置?比如说,找到&#34;你好&#34;的第一次出现的坐标。在file.pdf中

0 个答案:

没有答案