使用机器学习将文本拆分成单独的句子?

时间:2019-12-15 11:23:19

标签: machine-learning nlp

我正在使用javascript分析烹饪食谱,因此在确定食谱的不同步骤时遇到了这两个问题。

第一个问题,行尾或缩写,或两者兼有?

在下面的示例中,“分钟”是缩写,而不是行尾。一个简单的“最小”替换动作。只需几分钟即可解决此问题。

... heat mixture for another 2 to 3 min. and transfer ...

但是在这里它是缩写和该行的结尾。因此,simpel替换操作在这里不起作用。

... heat mixture for another 2 to 3 min. Transfer ...

第二个问题,“和”而不是“。”

使用单词“和”。我想知道“和”是将两个步骤加在一起还是要在同一步骤中使用2种成分。

Transfer green bean mixture to a casserole dish and sprinkle with French fried onions and remaining cheese.

我想将其拆分为:

  1. Transfer green bean mixture to a casserole dish
  2. Sprinkle with French fried onions and remaining cheese.(在其中保留“ and”)

我确定可以使用机器学习。我可以创建数据集来训练系统,但是如何编程系统?我是机器学习的新手,知道如何编程。

1 个答案:

答案 0 :(得分:0)

您是完全正确的,如果您构建带注释的数据集,则ML将为您提供帮助,在很多情况下,算法应将句子分开,而算法应将句子不分开。但是,在创建数据集之后,您应该了解ML并尝试其他算法,然后,如果它不起作用,则可以将问题发布在StackOverflow上,因为StackOverflow不是免费的编码服务,在这里人们可以帮助您调试和改进您的代码,但是您应该为他们提供代码,而不是问题说明。