存在couple of个有关以虚假方式获取名词块的问题,relatively straightforward。
我感兴趣的是在句子中的预定义ngram上复制依赖项解析。像下面的示例一样,来自this的恶意谈话,其中Alex Smith
和East London
在依赖项解析中被视为单个令牌。
答案 0 :(得分:1)
这可能是通过您指定的options
参数完成的
"collapse_phrases" : True
https://spacy.io/api/top-level#options-dep上的详细信息
创建一个svg文件的示例,您可以在浏览器中打开该文件
import spacy
from spacy import displacy
from pathlib import Path
nlp = spacy.load('en_core_web_sm', parse=True, tag=True, entity=True)
doc = nlp("Alex Smith was fatally stabbed in East London")
print(doc.ents)
options = {"color": "white", "collapse_phrases" : True, "bg": "#000000"}
svg = displacy.render(doc, style="dep", options=options)
output_path = Path("dependency_plot.svg")
output_path.open("w", encoding="utf-8").write(svg)