nltk

时间:2015-05-10 18:59:58

标签: python nltk

我有以下具有结构的String: "电影名称是美国导演的名字" 我想在nltk中使用正则表达式定义一个模式来提取这样的东西 [('电影名称')] ('是') [('美国&#39)] ('由'指示) [('名称&#39)]

请帮助定义模式,我是python和nltk的新手。 谢谢

1 个答案:

答案 0 :(得分:0)

如果有人发现有帮助,请发布此信息:

 pattern= re.match( r'(.*) is (.*?) directed by (.*?).*', item, re.M|re.I)

在这种模式中,结果将是:

pattern.group(1): film name
pattern.group(2): category
pattern.group(3): director name