无法识别Dart RegExp空白

时间:2020-08-19 16:45:17

标签: regex flutter dart

我正在尝试为用户名实现正则表达式模式,以允许英文字母,阿拉伯字母,数字,破折号和空格。

即使输入字符串中包含\ s,以下模式也始终不返回匹配项

Pattern _usernamePattern = r'^[a-zA-Z0-9\u0621-\u064A\-\s]{3,30}$';

我还尝试用“”和\\ s替换\ s,但是正则表达式对于其中有空格的任何输入始终不返回匹配项。

编辑:事实证明,当使用具有LTR或RTL混合语言的文本字段时,flutter为“从右至左标记”或“从左至右标记”添加了Unicode字符。这个额外的标记是一个Unicode字符,已添加到文本中。由于此附加字符,上述正则表达式失败。要解决此问题,只需对这些字符执行replaceAll即可。在此处了解更多信息:https://github.com/flutter/flutter/issues/56514

1 个答案:

答案 0 :(得分:2)

这是一个非常棘手的问题,值得在此处给出答案。

source中所述:

  /// When LTR text is entered into an RTL field, or RTL text is entered into an
  /// LTR field, [LRM](https://en.wikipedia.org/wiki/Left-to-right_mark) or
  /// [RLM](https://en.wikipedia.org/wiki/Right-to-left_mark) characters will be
  /// inserted alongside whitespace characters, respectively. This is to
  /// eliminate ambiguous directionality in whitespace and ensure proper caret
  /// placement. These characters will affect the length of the string and may
  /// need to be parsed out when doing things like string comparison with other
  /// text.

虽然这是很好的意图,但是当您使用混合的LTR / RTL文本模式时(在这种情况下)并必须确保确切的字段长度等,可能会导致问题。

suggested解决方案是删除所有left-right-marks

void main() {
  final String lrm = 'aaaa \u{200e}bbbb';
  print('lrm: "$lrm" with length ${lrm.length}');
  
  final String lrmFree = lrm.replaceAll(RegExp(r'\u{200e}', unicode: true), '');
  print('lrmFree: "$lrmFree" with length ${lrmFree.length}');
}

相关:right-to-left (RTL) in flutter