我很难搞清楚哪些库和数据集在一起。
工具包/图书馆我发现:
在所有这些中,有些缺少功能。例如,OpenNLP没有依赖解析。
我需要找到一个快速的库,它也可以进行依赖解析和词性标记。
下一个障碍是我们从哪里获取数据集。我发现了很多东西,但没有什么全面而全面的。
数据我发现:
我对哪些数据集需要哪些功能以及哪些实际可用的公开信息感到困惑。从我的研究看来,ClearNLP似乎效果最好,但数据却很少。
谢谢
答案 0 :(得分:3)
Stanford CoreNLP provides both POS tagging and dependency parsing out of the box (plus many other features!), it already has trained models so you don't need any data sets for it work!
Please let me know if you have any more questions about the toolkit!