许多自然语言都有前缀,可以为单词添加一些含义。
例如:anti
用于防病毒,co
用于协调员,counter
用于对方
检测stem
需要将这些前缀分开。假设有一个特定语言的前缀列表:
prefix_list = ['c', 'ca', 'ata', 'de']
如何在单词"catastrophic"
结果应该是:
['c', 'ca']
试验:
|
字符不支持重叠注释:
ata
不能成为结果,因为该字词不以ata
答案 0 :(得分:1)
不要使用正则表达式。改为使用列表理解:
[prefix for prefix in prefix_list if word.startswith(prefix)]
这将创建prefix_list
中word
前缀的所有条目的列表。