我正在尝试将我分析的文档集从ICA导出到WKS,但它说我必须从UIMA类型到WKS的实体类型进行映射。但我找不到任何解释,我该怎么办。 有谁知道该怎么办? 感谢
答案 0 :(得分:0)
几周前,当我提出这个问题时,我就这样做了。我做了以下步骤:
将UIMA类型映射到实体类型
在将XMI文件导入Watson Knowledge Studio项目之前,必须定义UIMA类型和Watson Knowledge Studio实体类型之间的映射。
开始之前
Watson Knowledge Studio项目中的类型系统必须包含要将UIMA类型映射到的实体类型。
将UIMA类型映射到WKS实体类型:
在包含UIMA TypeSystem描述符文件的文件夹中创建名为cas2di.tsv
的文件,例如exported_typesystem.xml
或TypeSystem.xml
。
使用文本编辑器打开cas2di.tsv
文件。文件中的每一行都指定一个映射。映射的格式取决于您要映射的注释器注释:
您可以使用基本格式创建映射:
UIMA_Type_Name[TAB]WKS_Entity_Type
以下示例定义了IBM Watson Explorer Content Analytics中的命名实体识别注释器生成的UIMA类型与WKS类型系统中定义的实体类型之间的映射:
com.ibm.langware.Organization ORGANIZATION
com.ibm.langware.Person PERSON
com.ibm.langware.Location LOCATION
另一个示例定义了在IBM Watson Explorer Content Analytics Studio和Watson Knowledge Studio实体类型中创建的自定义注释器生成的UIMA类型之间的映射:
com.ibm.Person PERSON
com.ibm.Date DATE
您可以根据Watson Explorer Content Analytics中的Pattern Matcher注释器或Dictionary Lookup注释器中使用的构面创建映射。在文本分析规则文件(* .pat)中,构面表示为类别属性。要定义映射,请使用以下语法:
com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]WKS_ENTITY_TYPE
像:
com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]ORGANIZATION