标签: java nlp data-mining pos-tagger information-extraction
我正在寻找一种从Java中的非结构化文本中自动提取特定于域的知识的方法。我们将拥有一个手动注释的训练集,其中包含以下内容:
文字:该公寓包含2间卧室和一间浴室。 结构化的 - 类型:公寓 - 卧室:2 - 浴室:1
知道什么是培养能够完成这项工作的模型的最佳方法?可能是我们使用自定义标签扩展的POS标签?
谢谢!