我想生成PDF文件或转换使用Tj运算符的现有PDF文件来表示带有T1的字符串以表示文本引导,它不应包含TJ运算符和TD运算符。我必须在acrobat酒糟服务器6.0.1或adobe illustrator的设置中设置。在这个问题上帮助我。
目前我正在使用这些运算符来识别和搜索文本,并将它们存储为我的目的字典。
答案 0 :(得分:0)
我认为Distiller不支持任何类型的东西。
我建议您找一种更好的方法来提取文字。即使您的所有文本都使用Tj
而不是其他文本显示操作符(而不仅仅是TJ),如果您遇到自定义编码,仍然会遇到麻烦。让其他已经解决了这个问题的人为你做这件事。
有很多程序可以很好地从PDF中提取文本。最好的仍然是Acrobat / Reader ......所以如果你不能从Reader中选择/复制/粘贴文本,那么其他软件也无法工作...保存OCR( O potical C haracter R ecognition)。
我偏向于iText(Java)和iTextSharp(C#)......我是一个提交者。尽管如此,还有很多其他应用程序基本上做同样的事情......坐在免费软件/自由软件/商业频谱的各个地方。哎呀,iTexts坐在那个频谱的几个地方。 :rolleyes: