Question

我有一个由许多行组成的字符串，其中包含纯数字和可能包含数字的单词，例如：

1 11 blabla12_ho5::blabla14_ho4

我想摆脱这些词，只留下纯数字，结果将是：

1 11

我已经尝试使用正则表达式“[^ ]*[^\d][^ ]*”来捕获单词并使用regsub将其删除为空字符串。但它也会捕获第二个数字并返回：

什么是正确的正则表达式？

Answer 1

单词边界后跟一系列数字后跟单词边界：

\b(\d+)\b

Answer 2

您正在寻找的是更接近这一点：

/\D(\d+)\D/g

Answer 3

捕捉号码和字母（不包括纯数字）：\b(?!\d+\b)\w+\b
捕获纯数：\b(\d+)\b

Answer 4

不同的RegEx解析器将使用稍微不同的语法。你试图用这个正则表达式做什么？

你的问题的答案在于贪婪与懒惰的匹配。

Answer 5

由于你问的是RegEx的问题，这有点像你的问题，但是对于你正在做的事情，如果你想要做的只是前两列而你使用Linux，你可以做一些像

cut -d ' ' -f 1-2 myfile.txt

Answer 6

你可以使用grep：

echo "1 11 blabla12_ho5::blabla14_ho4" | grep -E -o "\b[[:digit:] ]+\b"
1 11

Answer 7

设法捕获包含特殊字符以及字母和数字但没有找到纯数字的单词的正则表达式是：

\b[^ ]*[^\d ]+[^ ]*