NLP算法在语言翻译中提取部分句子

时间:2018-07-08 17:23:15

标签: nlp nltk linguistics

我正在尝试解决问题,但是除了训练数据集和进行分类器之外,找不到其他方法。

问题:

用户说要将特定的句子从一种语言翻译成另一种语言。我在文本部分有用户语音,需要从文本中提取以下三点:

  • 要翻译的句子。
  • 应该翻译的语言。
  • 原始语言。

所以,当我们人类说时,它通常以以下示例的形式出现:

  • 我用英语用法语爱你吗?
  • 可以将我爱你从英语翻译成法语吗?
  • 我用英语爱你是什么法语?

以及其他人可能要求翻译的方式。

我需要从句子中提取I love youFrench(翻译成的语言)和English(翻译成的语言)。 我想到的第一件事就是使用Regular Expessions。但是我发现它只能用于检测语言,而不能用于检测要翻译的句子部分。

另一种可能的解决方案似乎具有多种形式的句子作为训练数据集和训练分类器,但是我仍然觉得可以使用某种算法来解决此NLP问题,但无法获得任何结果。

这似乎是一个很普遍的问题,那么有什么办法可以解决?

0 个答案:

没有答案