我开始尝试aws理解。我注意到的一件事是,文档中的句子将影响情感分析和实体提取结果,尤其是当存在混合情感句子或文档中某些句子没有大写时。因此正确拆分句子是重要的一步。但是,我找不到能将文档拆分为句子的API。是因为理解没有步骤吗?如果有,有人可以指出如何获得分割结果吗?
顺便说一句,我尝试了斯坦福大学的coreNLP和Google Language Cloud。他们都在某些情况下犯错。
答案 0 :(得分:0)
这是我所做的:我在抓取评论时添加了“>>>”作为评论之间的分隔符,然后我使用了以下代码:
reviews = all_reviews_as_text.split('>>>')
responses = []
for review in reviews:
response = comprehend.detect_sentiment(Text=review, LanguageCode="en")
responses.append(response)