通过正则表达式识别句子中的单词

时间:2019-02-14 10:40:59

标签: regex

我正在处理正则表达式问题,需要识别以下自然语言句子中的单词,这些单词实际上是数字,例如:

  1. 一百一十一
  2. 一百减一
  3. 百乘一

我正在尝试得出一个仅与上述语句中的数字(例如“一百”,“一千一十一”等)相匹配的正则表达式,但无法做到这一点。到目前为止,这是我已经完成的工作:

如果我使用类似的内容:

([o][n][e]|[h][u][n][d][r][e][d]).*?([o][n][e]|[h][u][n][d][r][e][d])

然后它仅在“一百”中匹配“一百”,如果我使用的话:

([o][n][e]|[h][u][n][d][r][e][d]).*([o][n][e]|[h][u][n][d][r][e][d]), 

然后匹配整个“一百零一一百零一”

有人可以指导我如何进行此操作吗?

0 个答案:

没有答案