在不同字符串参数之间为文档相似性建模的最佳方法是什么?

时间:2018-11-06 07:00:18

标签: python machine-learning modeling sentence-similarity question-answering

我在预测用户所面临问题的解决方案方面遇到问题。

问题设置如下:

我们有一个问题和解决方案的数据库。对于每个问题,我们都有三个参数来表示。

  1. 职位名称(字符串-职位名称)
  2. JobId (整数-职位ID)
  3. RootCause (字符串-该问题的原因)。

每个问题都有面对该问题的用户添加的相应解决方案。该解决方案参数是

  1. 解决方案(字符串-用户为该问题输入的解决方案)

因此,我们想利用该数据库并预测新问题的解决方案(问题是一组作业名,作业ID,根本原因-全部是字符串)

我们最初想出了这个解决方案。 我们只想确定与我们的查询问题类似的问题(作业名,作业ID,根本原因集),并提供最接近问题的解决方案。 但是在这种情况下,我们无法像在房价预测问题中那样衡量培训误差。

通常,我们如何解决这个问题,以及我们需要使用哪种机器学习模型?

1 个答案:

答案 0 :(得分:0)

似乎,您想要构建一种推荐系统。根据问题的原因,提出建议的解决方案列表。一种可能的解决方案-将word2vec用于向量化thread.start(),然后尝试使用向量相似度来发现类似问题。