如何使用内容分析来映射沃森知识工作室?

时间:2017-05-18 14:36:52

标签: ibm-watson watson

我正在尝试将我分析的文档集从ICA导出到WKS,但它说我必须从UIMA类型到WKS的实体类型进行映射。但我找不到任何解释,我该怎么办。 有谁知道该怎么办? 感谢

1 个答案:

答案 0 :(得分:0)

几周前,当我提出这个问题时,我就这样做了。我做了以下步骤:

将UIMA类型映射到实体类型

在将XMI文件导入Watson Knowledge Studio项目之前,必须定义UIMA类型和Watson Knowledge Studio实体类型之间的映射。

开始之前

Watson Knowledge Studio项目中的类型系统必须包含要将UIMA类型映射到的实体类型。

将UIMA类型映射到WKS实体类型:

  1. 在包含UIMA TypeSystem描述符文件的文件夹中创建名为cas2di.tsv的文件,例如exported_typesystem.xmlTypeSystem.xml

  2. 使用文本编辑器打开cas2di.tsv文件。文件中的每一行都指定一个映射。映射的格式取决于您要映射的注释器注释:

  3. 您可以使用基本格式创建映射:

    UIMA_Type_Name[TAB]WKS_Entity_Type
    

    以下示例定义了IBM Watson Explorer Content Analytics中的命名实体识别注释器生成的UIMA类型与WKS类型系统中定义的实体类型之间的映射:

    com.ibm.langware.Organization  ORGANIZATION
    com.ibm.langware.Person  PERSON
    com.ibm.langware.Location  LOCATION
    

    另一个示例定义了在IBM Watson Explorer Content Analytics Studio和Watson Knowledge Studio实体类型中创建的自定义注释器生成的UIMA类型之间的映射:

    com.ibm.Person  PERSON
    com.ibm.Date  DATE
    

    您可以根据Watson Explorer Content Analytics中的Pattern Matcher注释器或Dictionary Lookup注释器中使用的构面创建映射。在文本分析规则文件(* .pat)中,构面表示为类别属性。要定义映射,请使用以下语法:

    com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]WKS_ENTITY_TYPE
    

    像:

    com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]ORGANIZATION
    

    请参阅Official Documentation