如何对字符串进行标记?

时间:2012-09-23 11:26:24

标签: nlp tokenize

我希望我的程序知道字符串是否是名词,动词,形容词等等,并且需要进行标记,但我该怎么做?

我是否需要数据库来定义单词?使用自由语境语法?

谢谢。

1 个答案:

答案 0 :(得分:1)

比这复杂得多。

你当前问题的答案都是。你们都会查找单词以查看它们的词性,并分析句子结构以确定词性。

查看http://wordnet.princeton.edu/,查看有关查找词性的信息。

我推荐GATE / Annie作为NLP的开源框架。 Apache有UIMA,虽然我还没有使用它。我相信这些项目之间有一些兼容性。