我想填充包含PDF中每个单词位置的数据结构。
我有一个PDF,最后我想迭代这些单词及其位置的数据结构。
以下内容:
public class MyPageViewModel : ViewModelBase
{
private String _selectedText;
public String SelectedText
{
get { return _selectedText; }
set {
if (_selectedText != value)
{
_selectedText = value;
}
}
}
public MyPageViewModel ()
{
_selectedText = "Welcome"; //Default text
}
private async Task<string> SomeTask()
{
return await Task.Run(async () =>
{
await Task.Delay(3000); //Dummy task. It will return the status of Task.
return "Thanks"; //Update Text
});
}
}
我知道PDF中的单词毫无意义,可能会发生多个文本调用(例如&#34;你好&#34; - &gt;&#34;他&#34; +&#34; llo&#34;或&# 34;地狱&#34; +&#34; o&#34;)。为了我的目的,应该没问题。
我不在这里寻找效率,所以很奇怪的解决办法很好。我目前的想法是我可以从PDF中提取文本,然后搜索文档上每个单词的位置(我知道它的可怕效率)。我如何在pdf中找到特定单词的位置?比如说,找到&#34;你好&#34;的第一次出现的坐标。在file.pdf中