标签: scikit-learn nlp
我的火车数据集中有三列-问题,答案和干扰项。
我们知道,MCQ有一个问题和4个选项。在这1个答案中,是正确的,其他3个是干扰因素。
我的测试集中有两列-问题和答案。而且我需要预测干扰因素。
请提出解决问题的方法。
答案 0 :(得分:0)
如果您需要机器学习解决方案:这是一个序列到序列的学习问题。但是,序列到序列的学习需要大量的训练数据,除非您有成千上万的示例,否则可能无法很好地发挥作用。
由特殊标记分隔的问题和答案将作为输入,而干扰因素的答案将作为输出。您可以使用OpenNMT,JoyeNMT,Marian之类的工具或其他任何用于seq2seq的工具。