我是自然语言处理领域的新手。我唯一的经验是使用standford nlp来获得句子的部分内容。
问题:我必须在一组产品反馈中找出前10条建议。
输入:它包含大约一百个反馈,作为某些产品的建议。
我无法弄清楚我应该从哪里开始工作。我应该在什么基础上创建十大建议?
答案 0 :(得分:1)
当您说您有一组反馈时,如果有任何分隔符字符串或涉及的内容,那么您可以使用正则表达式来分隔不同的反馈。 你可以参考这个链接
https://sites.google.com/site/gothnlp/links/regular-expressions
http://docs.python.org/2/library/re.html
如果分隔符类似于提交反馈的人的名字,那么您可以查看名为实体识别的概念,该概念可以分隔人名。
如果您可以使用NLTk工具包,那么我就会使用它...
http://www.slideshare.net/japerk/nltk-in-20-minutes
这是可以提供帮助的链接
此博客也可以帮助您