我正在为应用程序添加一个功能,在该应用程序中,学生回答更具描述性的问题。我很想知道是否有办法让系统“智能”足以评估这些答案。当然,我可以通过一组关键字来运行答案,以确保学生至少包含答案中的关键词,但显然这不够聪明。
我知道没有简单的方法来评分描述性答案,但我想知道是否有任何技术可供我研究。
答案 0 :(得分:1)
您可以使用mechanical turk这是人类的API。对于你的系统来说,这可能是你可以得到的。理解和评分实际文本是人类比计算机(即计算机吮吸)更好的最后遗留问题之一
一个值得注意的例外是Watson,它实际上非常擅长于Jeopardy,但它运行在一个庞大的计算集群上,包括一些严肃的优化和智能。这不是你打开的。遗憾...
答案 1 :(得分:0)
答案并非如此简单。那里有“自动分级系统”,我相信,例如,用于评分GRE考试。例如,请参阅this paper和this by ETS。