我有一个bash脚本,它包装了一对curl
,并通过其他一些内置函数进行管道传输。我想打印每个curl的结果,然后解析结果并发出包含其他信息的第三行。最终输出应如下所示:
https://e.thingzz.com/eqvjzc23xqo2s
https://e.thingzz.com/o7jlafrot2fok
https://e.thingzz.com/c/eqvjzc23xqo2s/o7jlafrot2fok
相反,它看起来像:
https://e.thingzz.com/eqvjzc23xqo2s
https://e.thingzz.com/o7jlafrot2fok
/o7jlafrot2fokv.com/c/eqvjzc23xqo2s
由于某种原因,它以前两行的确切长度包装。
脚本:
#!/usr/bin/env bash
function myCurl()
{
curl ... | ... | ...
#omitted, results in printing a url like 'https://e.thingzz.com/UUID'
}
# param validation omitted
URL1=$(myCurl "${1}")
URL2=$(myCurl "${2}")
# print both URLs
echo $URL1
echo $URL2
# Parse URLs to get ID at end
# I've also tried using `cut`, in case there were invisible characters?
# I don't really know what I'm talking about.
URLID1=$(echo $URL1 | awk -F 'https://thing.com/' '{print $2}')
URLID2=$(echo $URL2 | awk -F 'https://thing.com/' '{print $2}')
# Doesn't work. Looks like:
# /o7jlafrot2fokv.com/c/eqvjzc23xqo2s
echo https://thing.com/c/${URLID1}/${URLID2}
# Proves I can echo something longer
echo doneaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
# Also wraps, exactly like the `echo` version
echo $URLID1 $URLID2 | awk '{ printf "https://thing.com/c/%s/%s", $1, $2 }'
我距离bash专家还很远,也不知道这里发生了什么。我从命令行(而不是从调用脚本)尝试过这种方法,并且可以正常工作。我真的很茫然。
编辑:我将SCANID1替换为URLID1(也替换为2)。它们是复制粘贴错误。
答案 0 :(得分:5)
正如乔纳森·莱夫勒(Jonathan Leffler)在评论中指出的那样,最可能的解释是数据中存在Windows(CRLF)行尾。 Unix使用LF行尾。在终端上,CR字符将光标移动到该行的开头,而不将其移动到下一行。例如,如果您运行
printf '%s\r%s\n' wibble foo
您将看到fooble
,因为显示了wibble
,然后光标移至行的开头,foo
覆盖了wibble
的开头。
您的脚本与您的示例输出不完全匹配,但似乎该行
echo https://thing.com/c/${SCANID1}/${SCANID2}
产生的输出在行的开头具有斜杠和值为SCANID2
。发生这种情况是因为SCANID1
的值以CR字符结尾。
要使脚本对Windows行尾具有鲁棒性,请删除任何CR字符,或者至少删除行尾的任何CR字符(如果在其他位置有CR字符,则数据还有其他问题)。在bash中,"${var%$'\r'}"
给出var
的值减去末尾CR(如果该值以CR结尾),如果值不以CR结束则给出不变。
我建议及早剥离CR,以免出现任何问题:
URL1=$(myCurl "${1}"); URL1=${URL1%$'\r'}
URL2=$(myCurl "${2}"); URL2=${URL2%$'\r'}
(您不能在单个分配中结合使用命令替换和截断。)
但是您也可以在awk阶段执行此操作:
SCANID1=$(echo "$URL1" | awk -F 'https://thing.com/' '{print sub("\r", "", $2)}')
请记住,这里不需要调用awk。
SCANID1=${URL1#*https://*/}