我试图从简历中提取姓名,地址,资格等详细信息(ms 字).....
我知道简历通常采用不同的格式......
所以任何想法都会有所帮助.....
谢谢
答案 0 :(得分:0)
使用excel更容易做到这一点。因此,如果可能的话,请求excel格式的简历:
您需要创建一个Word
对象(在Visual Studio 2008和2010中有一个模板)并阅读文档文本并进行分析。由于不同的用户可能使用不同的语法,因此该方法非常容易出错。因此,您需要强制它们采用独特的语法,我们将回到相同的位置(Excel格式)。
答案 1 :(得分:0)
您可能希望了解一下开源Apache Tika工具包,该工具包可以从所有Microsoft产品套件中提取文本等等。
以下是可以解析的内容列表:http://tika.apache.org/0.5/formats.html