我对NLP世界全新,我需要你的帮助才能开始使用漂亮的Stanford pos tagger标记阿拉伯语句子。
我已经安装了一个完整版本,其中包含两个经过阿拉伯语培训的标记。
拜托,请指导我使用java和eclipse在阿拉伯语中应用这个标记器,
实际上,我已经浏览了斯坦福大学的官方网站,但它并没有那么有用
提前谢谢
答案 0 :(得分:1)
以下是您可以从中下载斯坦福解析器的链接:nlp.stanford.edu/software/lex-parser.shtml
我希望您已经在使用Java环境。所以进入放置解析器文件的目录。
java -mx200m edu.stanford.nlp.parser.lexparser.LexicalizedParser -retainTMPSubcategories -outputFormat "wordsAndTags,penn,typedDependencies" englishPCFG.ser.gz mumbai.txt
mumbai.txt是输入文件。
但我发现伯克利解析得更好。您可以从https://code.google.com/p/berkeleyparser/downloads/list
下载下载解析器jar文件和gramar用于阿拉伯语文本。
然后执行简单的命令:
java -jar BerkeleyParser-1.7gr eng_sm6.gr
现在输入您要解析的任何句子。
下载