标签: utf-8 character-encoding sed
我想了解为什么dot / asterisk无法匹配sed命令中的utf8字符:
$ echo "begin remove � end" | sed 's/remove.*//' begin � end
(预期结果应为begin )
begin
是因为 字符(U +00E0à)以3个字节表示吗?