标签: .net file
我正在尝试为我的主要项目制作一个e发现软件。任何人都可以建议开源api提取文件内容并保存到另一种格式或数据库。我正在考虑从不同的文件中挖掘并将它们保存为我自己的格式或数据库。文件类型包括所有办公室类型文件,电子邮件,pdf。类似于" Stellent"会很好但是开源。请找不到任何好的api。
答案 0 :(得分:1)
Apache Tika有一个.Net包装器 - TikaOnDotNet
这将从各种文件类型中提取文本。