提取详细信息的方式,例如姓名,短信中的ph号(ms字)

时间:2010-12-14 12:14:26

标签: .net

我试图从简历中提取姓名,地址,资格等详细信息(ms 字).....

我知道简历通常采用不同的格式......

所以任何想法都会有所帮助.....

谢谢

2 个答案:

答案 0 :(得分:0)

使用excel更容易做到这一点。因此,如果可能的话,请求excel格式的简历:

您需要创建一个Word对象(在Visual Studio 2008和2010中有一个模板)并阅读文档文本并进行分析。由于不同的用户可能使用不同的语法,因此该方法非常容易出错。因此,您需要强制它们采用独特的语法,我们将回到相同的位置(Excel格式)。

答案 1 :(得分:0)

您可能希望了解一下开源Apache Tika工具包,该工具包可以从所有Microsoft产品套件中提取文本等等。

以下是可以解析的内容列表:http://tika.apache.org/0.5/formats.html