如何查找具有多个重音的单词

时间:2016-01-17 12:30:47

标签: regex perl nlp text-processing

我有一个包含数千行的列表,并且我正在尝试识别包含带有多个重音字符的单词的行以供进一步分析。可能有用破折号分隔的单词,只有当其中一个部分包含至少两个重音字符时才会有趣。

从以下列表中

caouennec lanvézéac
caouennec lanvezéac
caouennec-lanvezéac
caouennec lanvezeac
caouennec-lanvézéac

我想找到

caouennec lanvézéac
caouennec-lanvézéac

1 个答案:

答案 0 :(得分:-3)

我成功地使用以下(Perl风味)Regex找到了这些行:

^.*[ÁÉÍÓÚáéíóú][^- ]*[ÁÉÍÓÚáéíóú].*$

匹配包含一组未被空格或破折号分隔但包含多个指定字符的字符的每一行。