将用户数据解析为文本 - 文本中没有格式

时间:2013-05-21 22:50:11

标签: java c++ parsing text-parsing user-data

我的重点是解析一些纯文本,其中包含有关用户的信息,包括每个用户使用的浏览器,版本和操作系统,并提取此类信息(浏览器/版本,操作系统/版本...... 。)

是否存在具有类似问题焦点的通用框架工作/库(在Java [首选]或C ++中)?我相信每个解析问题可能有不同的属性,需要稍微不同的方法,但如果你知道任何,请分享或建议,因为这将有助于澄清问题的步骤,并可能避免重复工作或错误或提高效率。

我找到了Oracle用于文本分析的模式,这看起来非常有趣:(http://www.oracle.com/webfolder/technetwork/data-quality/edqhelp/Content/processor_library/text_analysis/parse.htm

输入数据量可能相当大,但为了简化问题,我们现在可以忽略大量数据。

0 个答案:

没有答案