如何在给定文本文件中用linux中的选项卡替换空格?
答案 0 :(得分:160)
UNEXPAND(1) User Commands UNEXPAND(1)
NAME
unexpand - convert spaces to tabs
SYNOPSIS
unexpand [OPTION]... [FILE]...
DESCRIPTION
Convert blanks in each FILE to tabs, writing to standard output. With
no FILE, or when FILE is -, read standard input.
Mandatory arguments to long options are mandatory for short options
too.
-a, --all
convert all blanks, instead of just initial blanks
--first-only
convert only leading sequences of blanks (overrides -a)
-t, --tabs=N
have tabs N characters apart instead of 8 (enables -a)
-t, --tabs=LIST
use comma separated LIST of tab positions (enables -a)
--help display this help and exit
--version
output version information and exit
. . .
STANDARDS
The expand and unexpand utilities conform to IEEE Std 1003.1-2001
(``POSIX.1'').
答案 1 :(得分:38)
我想你可以试试awk
awk -v OFS="\t" '$1=$1' file1
或SED如果你喜欢
sed 's/[:blank:]+/,/g' thefile.txt > the_modified_copy.txt
甚至tr
tr -s '\t' < thefile.txt | tr '\t' ' ' > the_modified_copy.txt
或Sam Bisbee提取的tr解决方案的简化版本
tr ' ' \\t < someFile > someFile
答案 2 :(得分:9)
使用 Perl :
perl -p -i -e 's/ /\t/g' file.txt
答案 3 :(得分:9)
更好的 tr 命令:
tr [:blank:] \\t
这将清除say unzip -l </ strong>的输出,以便使用grep,cut等进行进一步处理。
如,
unzip -l some-jars-and-textfiles.zip | tr [:blank:] \\t | cut -f 5 | grep jar
答案 4 :(得分:3)
下载并运行以下脚本,以便将纯选项卡递归转换为纯文本文件中的硬标签。
从包含纯文本文件的文件夹中放置并执行脚本。
#!/bin/bash
find . -type f -and -not -path './.git/*' -exec grep -Iq . {} \; -and -print | while read -r file; do {
echo "Converting... "$file"";
data=$(unexpand --first-only -t 4 "$file");
rm "$file";
echo "$data" > "$file";
}; done;
答案 5 :(得分:2)
用于将当前目录下的每个.js文件转换为制表符的示例命令(仅转换前导空格):
find . -name "*.js" -exec bash -c 'unexpand -t 4 --first-only "$0" > /tmp/totabbuff && mv /tmp/totabbuff "$0"' {} \;
答案 6 :(得分:1)
您也可以使用astyle
。我发现它非常有用,它也有几个选项:
Tab and Bracket Options:
If no indentation option is set, the default option of 4 spaces will be used. Equivalent to -s4 --indent=spaces=4. If no brackets option is set, the
brackets will not be changed.
--indent=spaces, --indent=spaces=#, -s, -s#
Indent using # spaces per indent. Between 1 to 20. Not specifying # will result in a default of 4 spaces per indent.
--indent=tab, --indent=tab=#, -t, -t#
Indent using tab characters, assuming that each tab is # spaces long. Between 1 and 20. Not specifying # will result in a default assumption of
4 spaces per tab.`
答案 7 :(得分:0)
这将用一个空格(但不是制表符)替换连续的空格。
tr -cs '[:space:]'
答案 8 :(得分:0)
如果您要谈论用制表符替换一行中的所有连续空格,请使用tr -s '[:blank:]' '\t'
。
[root@sysresccd /run/archiso/img_dev]# sfdisk -l -q -o Device,Start /dev/sda
Device Start
/dev/sda1 2048
/dev/sda2 411648
/dev/sda3 2508800
/dev/sda4 10639360
/dev/sda5 75307008
/dev/sda6 96278528
/dev/sda7 115809778
[root@sysresccd /run/archiso/img_dev]# sfdisk -l -q -o Device,Start /dev/sda | tr -s '[:blank:]' '\t'
Device Start
/dev/sda1 2048
/dev/sda2 411648
/dev/sda3 2508800
/dev/sda4 10639360
/dev/sda5 75307008
/dev/sda6 96278528
/dev/sda7 115809778
如果您要替换所有空格(例如空格,制表符,换行符等),请tr -s '[:space:]'
。
[root@sysresccd /run/archiso/img_dev]# sfdisk -l -q -o Device,Start /dev/sda | tr -s '[:space:]' '\t'
Device Start /dev/sda1 2048 /dev/sda2 411648 /dev/sda3 2508800 /dev/sda4 10639360 /dev/sda5 75307008 /dev/sda6 96278528 /dev/sda7 115809778
如果您要修复的是制表符损坏的文件,请使用expand
和unexpand
,如其他答案中所述。
答案 9 :(得分:0)
使用 sed :
T=$(printf "\t")
sed "s/[[:blank:]]\+/$T/g"
或
sed "s/[[:space:]]\+/$T/g"