标签: entity corpus
我正在寻找同一时期文本和语音(转录)的英语新闻域的命名实体标记语料库。如果有人有关于语料库的任何信息,请发给我链接。
由于 Khadaka
答案 0 :(得分:3)
我发现Open American National Corpus非常有用。他们确实提供了包含新闻文本和转录语音的named-entity tagged portion,但请注意,它使用BBN NE Tagger进行标记,而非人群。不过,我使用这种语料库引导其他模型的结果不错。