我有以下具有结构的String: "电影名称是美国导演的名字" 我想在nltk中使用正则表达式定义一个模式来提取这样的东西 [('电影名称')] ('是') [('美国&#39)] ('由'指示) [('名称&#39)]
请帮助定义模式,我是python和nltk的新手。 谢谢
答案 0 :(得分:0)
如果有人发现有帮助,请发布此信息:
pattern= re.match( r'(.*) is (.*?) directed by (.*?).*', item, re.M|re.I)
在这种模式中,结果将是:
pattern.group(1): film name
pattern.group(2): category
pattern.group(3): director name