Question

为这样的虚拟问题道歉，但这是我第一次使用curl命令，现在我从某个地方获取此命令以提取以下字符串

{＆＃34;成功＆＃34;：真，＆＃34;结果＆＃34;：1，＆＃34;总＆＃34;：1，＆＃34;更＆＃34;：假，＆＃ 34;偏移＆＃34;：0，＆＃34;命中＆＃34;：[{＆＃34;路径＆＃34;：＆＃34; /家庭/用户/ Vq7DPVRHzGVK - OTJsHs＆＃34;＆＃34;摘录＆＃34;：＆＃34;＆＃34;＆＃34;名称＆＃34;：＆＃34; Vq7DPVRHzGVK - OTJsHs＆＃34;＆＃34;标题＆＃34;：＆＃34; Vq7DPVRHzGVK- -OTJsHs＆＃34;＆＃34;上次更改时间＆＃34;：＆＃34; 2017年3月3日 16：45：46＆＃34;，＆＃34;创建＆＃34;：＆＃34; 2017-03-03 16：45：46＆＃34;}]}

我使用以下脚本将curl输出传递给sed：

sed -e 's/^.*"path":"\([^"]*\)".*$/\1/

结果：

/家庭/用户/ Vq7DPVRHzGVK - OTJsHs

任何人都可以解释这里的正则表达式是如何工作的吗？如何只获得 Vq7DPVRHzGVK-OTJsHs 的结果，而不是包含/ home / user路径？

Answer 1

说明：

s/   ^.*"path":"\([^"]*\)".*$   /  \1   /
      ----------^------------     ---^---
             Pattern         Replacement string

正则表达式如何工作：

^.*         # Match beginning of input string & anything else
"path":"    # Up to literal string `"path":"`
\([^"]*\)   # Then match slash and match + group anything up to a double quote `"`
".*$        # Match double quote and the rest of input string

通过替换字符串\1，您将使用第一个捕获组替换整个匹配部分，这是除了开始斜杠之外的路径值的双引号之间的所有内容。

您想要的是将捕获组从捕获整个部分更改为最后一部分：

s/^.*"path":"[^"]*\/\([^"]*\)".*$/\1/

Answer 2

Regex demo

正则表达式：.*"path\":"\K[\/\w]+(?=\/)\/\K[^"]+

sed JSON正则表达式

2 个答案: