如何在JSON中存储令牌信息的自定义属性并用于培训

时间:2019-10-10 12:12:12

标签: nlp spacy

使用gold.docs_to_json,我无法在JSON中存储自定义令牌属性

{
    "id": 0,
    "paragraphs": [
        {
            "raw": "Complete the nlp task",
            "sentences": [
                {
                    "tokens": [
                        {
                            "id": 0,
                            "orth": "Complete",
                            "tag": "VB",
                            "head": 0,
                            "dep": "ROOT",
                            "ner": "O"
                        },
                        {
                            "id": 1,
                            "orth": "the",
                            "tag": "DT",
                            "head": 2,
                            "dep": "det",
                            "ner": "O"
                        },
                        {
                            "id": 2,
                            "orth": "nlp",
                            "tag": "NN",
                            "head": 1,
                            "dep": "compound",
                            "ner": "O"
                        },
                        {
                            "id": 3,
                            "orth": "task",
                            "tag": "NN",
                            "head": -3,
                            "dep": "dobj",
                            "ner": "O"
                        }
                    ],
                    "brackets": []
                }
            ]
        }
    ]
}

如何存储自定义属性? 我也可以使用spacy train训练自定义属性。


无关紧要的细节: 我知道可以创建一个自定义doc_to_json来存储自定义属性,但是如果我无法训练模型来标记自定义属性,那就没用了。

0 个答案:

没有答案