从文本中提取成分内容单词

时间:2015-08-26 14:04:44

标签: python pandas nltk pos-tagger

如果这个问题已经回答,我应该先道歉。我在这里找不到。我的问题如下。我有一个预先列出的单词列表,我也有一些像这样的非结构化文本。

2 1/2 cups all-purpose flour
1 cup rolled oats
1/2 teaspoon ground ginger
1 cup chopped walnuts
1 teaspoon vanilla extract
1 teaspoon pumpkin pie spice
1 teaspoon celery oil

我的列表包含以下匹配的关键字[面粉,燕麦,姜,核桃,芹菜,芹菜,油......]。我想将非结构化文本转换为我的匹配关键字列表。如下所示。

flour
oat
ginger
walnut
vanilla 
pumpkin
celery_oil

任何人都可以建议我使用python转换这些项目的方法。目前我对熊猫有一些经验。非常感谢你!

0 个答案:

没有答案