标签: data-mining data-extraction
是否有最佳实践,算法或软件(需要许可许可的开源......)可以从文本正文中查找信息?我指的是:
我听说RapidMiner应该能够像这样进行文本挖掘,但AGPL不是我可接受的许可证。
进行这种分析有什么“标准”吗?
答案 0 :(得分:1)
了解Named Entity Recognition。您可以尝试Apache OpenNLP或Apache UIMA,两者都具有Apache许可证。
答案 1 :(得分:1)
对于此类实体类型,您可以使用基于规则的NER工具,例如gexp。