我正在尝试为欠资源语言构建NLP语料库,因为没有可用于NLP研究的数据。可以任何人建议,如何建立或继续使其成为标准的NLP语料库,任何标准方法或纸张或链接。 提前致谢
答案 0 :(得分:2)
我建议在华盛顿大学和费孝夏这样的人联系,他曾在宾夕法尼亚大学伯班克分校工作过,并且是宾夕法尼亚大学的帽子专家或者一些人。
在树库上构建完整的解析和标记并不是一项简单的任务。你究竟想做什么?目标是什么? -parsing /标记? -semantics? - 信息提取? -phonetics?
老实说,根据评论,这听起来像整个语言学家团队的项目。