文件中的最长行

时间:2009-10-31 19:34:37

标签: bash shell utilities

我正在寻找一种简单的方法来查找文件中最长行的长度。理想情况下,它将是一个简单的bash shell命令而不是脚本。

14 个答案:

答案 0 :(得分:240)

使用wc(GNU coreutils)7.4:

wc -L filename

给出:

101 filename

答案 1 :(得分:91)

awk '{print length, $0}' Input_file |sort -nr|head -1

供参考:Finding the longest line in a file

答案 2 :(得分:62)

awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }'  YOURFILE 

答案 3 :(得分:22)

仅仅为了娱乐和教育目的,纯POSIX shell解决方案,不会无用地使用cat而不会分叉外部命令。将filename作为第一个参数:

#!/bin/sh

MAX=0 IFS=
while read -r line; do
  if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"

答案 4 :(得分:13)

wc -L < filename

给出

101

答案 5 :(得分:11)

perl -ne 'print length()."  line $.  $_"' myfile | sort -nr | head -n 1

打印最长行的长度,行号和内容

perl -ne 'print length()."  line $.  $_"' myfile | sort -n

打印所有行的排序列表,包含行号和长度

.是连接运算符 - 在length()之后使用它 $.是当前行号
$_是当前行

答案 6 :(得分:4)

上述例子中重要的忽略点。

以下2个示例计算扩展标签

  wc -L  <"${SourceFile}" 
# or
  expand --tabs=1 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'

以下2个计算未显示的标签。

  expand --tabs=1 "${SourceFile}" | wc -L 
# or
  awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"

所以

              Expanded    nonexpanded
$'nn\tnn'       10            5

答案 7 :(得分:4)

看起来所有答案都没有给出最长行的行号。以下命令可以给出行号和大致长度:

$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11

答案 8 :(得分:3)

以下是anwser的参考资料

cat filename | awk '{print length, $0}'|sort -nr|head -1

http://wtanaka.com/node/7719

答案 9 :(得分:3)

在perl:

perl -ne 'print ($l = $_) if (length > length($l));' filename | tail -1

这只打印线,而不是它的长度。

答案 10 :(得分:2)

只是为了好玩,这是Powershell版本:

cat filename.txt | sort length | select -last 1

只是得到长度:

(cat filename.txt | sort length | select -last 1).Length

答案 11 :(得分:2)

我在Unix环境中,使用大小为几GB的gzip文件。我使用记录长度为2052的2 GB gzip压缩文件测试了以下命令。

  1. zcat <gzipped file> | wc -L
    1. zcat <gzipped file> | awk '{print length}' | sort -u
    2. 时代充满了期待

      1. 117秒

      2. 109秒

      3. 这是我大约10次运行后的脚本。

        START=$(date +%s) ## time of start
        
        zcat $1 |  wc -L
        
        END=$(date +%s) ## time of end
        DIFF=$(( $END - $START ))
        echo "It took $DIFF seconds"
        
        START=$(date +%s) ## time of start
        
        zcat $1 |  awk '{print length}' | sort -u
        
        END=$(date +%s) ## time of end
        DIFF=$(( $END - $START ))
        echo "It took $DIFF seconds"
        

答案 12 :(得分:1)

主题的变化。

这一行将显示所有行,这些行具有文件中找到的最长行的长度,保留它们在源中出现的顺序。

FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE

所以myfile

x
mn
xyz
123
abc

将给出

xyz
123
abc

答案 13 :(得分:0)

如果您使用的是MacOS并收到此错误: wc: illegal option -- L不需要安装GNU。

如果只想获取文件最长行中的字符数,并且您正在使用OS X,请运行:

awk '{print length}' "$file_name" | sort -rn | head -1

像这样的东西

echo "The longest line in the file $file_name has $(awk '{print length}' "$file_name" | sort -rn | head -1) characters"

输出:

The longest line in the file my_file has 117 characters