如何训练Watson Knowledge Studio机器学习注释器,以识别不属于正确句子的教育信息。例如,两个要点。如何构建一个类型系统来识别实体而不会将它们分开?我考虑过使用关系注释,但是根据官方文档的关系类型,只有在句子明确提到关系时才应注释。例如“Mary for IBM”是就业关系类型的一个例子。 (玛丽雇佣了IBM)然而,他们自己的视频显示他们注释“福特F-150”具有制造关系,即使该句子没有明确说明这种关系。例如,“福特F-150发射了一根灯杆。” (F-150由Ford制造)
这是我正在使用的文字:
我可以用学位,学校和毕业年份来注释这些实体,但我最终会回到“1995”,“1997”,“1999”“BA”,“纽约城市大学”,“哥伦比亚大学” “,”MA“,”纽约大学“,”博士“;一个我无法合作的混乱,因为我不知道什么程度属于哪个学位属于毕业年份。
答案 0 :(得分:1)
对于包含两个要点的表达式,使用基于字典的Tokenizer可以提高检测句子的准确性,因为它们可以与WKS一起使用。 https://console.bluemix.net/docs/services/knowledge-studio/create-project.html#wks_tokenizer
我将您的示例文本导入WKS并检查了标记化的结果,然后将表达式分成3个句子。 在这种情况下,您可以注释学位,学校和毕业年份之间的关系。