使用gold.docs_to_json,我无法在JSON中存储自定义令牌属性
{
"id": 0,
"paragraphs": [
{
"raw": "Complete the nlp task",
"sentences": [
{
"tokens": [
{
"id": 0,
"orth": "Complete",
"tag": "VB",
"head": 0,
"dep": "ROOT",
"ner": "O"
},
{
"id": 1,
"orth": "the",
"tag": "DT",
"head": 2,
"dep": "det",
"ner": "O"
},
{
"id": 2,
"orth": "nlp",
"tag": "NN",
"head": 1,
"dep": "compound",
"ner": "O"
},
{
"id": 3,
"orth": "task",
"tag": "NN",
"head": -3,
"dep": "dobj",
"ner": "O"
}
],
"brackets": []
}
]
}
]
}
如何存储自定义属性?
我也可以使用spacy train
训练自定义属性。
无关紧要的细节: 我知道可以创建一个自定义doc_to_json来存储自定义属性,但是如果我无法训练模型来标记自定义属性,那就没用了。