我想解析我用ABCPDF下载的PDF文档,但是我无法找到文档中的任何元素或者如何访问它们并迭代它们。我想解析一些文字。
var webClient = new WebClient();
var bytes = webClient.DownloadData("http://test.com/test.pdf");
var doc = new Doc();
doc.Read(bytes);
答案 0 :(得分:2)
使用Doc.GetText方法从当前页面中提取内容,指定要返回内容的格式。
doc.PageNumber = 1;
string pageContent = doc.GetText("Text");
上面的示例将按布局顺序返回纯文本。指定“SVG”或“SVG +”会返回附加信息以及文本,例如样式和位置。