我正在寻找有关如何执行我的想法的一些指示。 我会有配方的配方'名称,设备清单和烹饪方法。我想要做的是将烹饪方法简化为动作动词,成分'名称和设备的名称。
输出将存储在列表中。 产量:1。裂纹,鸡蛋,水罐 加,胡椒,水罐 3.加入盐,水壶
答案 0 :(得分:0)
使用NLP,您可以将整个文本标记为词性。标记整个文字后,您知道ingredients
和equipments
始终是名词,而“动作动词”是动词。现在,您可以分三个部分解决问题
在 1 中,您可以使用所有名词,并使用word frequency
创建“一袋设备和配料词”。这种技术背后的基本原理是,这些词更可能被频繁使用,因为它们是问题域的一部分。然后,为了区分彼此,您可以使用数据挖掘,例如亲和力分析。
在 2 中,您可以解析一堆食谱,提取所有动词并获得最常用的动词。创建一个“动词包”并使用词干将它们置于不定式或基本形式。例如,“切割”和“切割”应与“切割”相同。使用这个种子(你的动词包),你可以使用正则表达式在你的食谱中扫描这些动词。
在 3 中,您需要找到句型。也许你会找到不止一个
这是一个很好的起点,应该给你一些想法。结合NLP和数据挖掘/机器学习来更深入地了解您的数据