Pergunta

Eu estou procurando uma maneira simples de encontrar o comprimento da linha mais longa em um arquivo. Idealmente, seria um simples comando de shell bash em vez de um script.

Foi útil?

Solução

Usando wc (coreutils GNU) 7.4:

wc -L filename

dá:

101 filename

Outras dicas

awk '{print length, $0}' Input_file |sort -nr|head -1

Para referência: Encontrando a linha mais longa em um arquivo

awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }'  YOURFILE 

Apenas por diversão e finalidade educacional, o solução pura POSIX shell , sem o uso inútil de gato e não bifurcação para comandos externos. Toma nome do arquivo como primeiro argumento:

#!/bin/sh

MAX=0 IFS=
while read -r line; do
  if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
wc -L < filename

101
perl -ne 'print length()."  line $.  $_"' myfile | sort -nr | head -n 1

Imprime o comprimento e número de linha, e o conteúdo da linha mais longa

perl -ne 'print length()."  line $.  $_"' myfile | sort -n

imprime uma lista ordenada de todas as linhas, com os números de linha e os comprimentos

. é o operador de concatenação - ele é usado aqui depois de comprimento ()
$. é o número da linha atual
$_ é a linha atual

Importante ponto negligenciado nos exemplos acima.

2 Os exemplos seguintes Quantidade de abas expandidas

  wc -L  <"${SourceFile}" 
# or
  expand --tabs=1 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'

Os seguintes 2 contagem não expaned guias.

  expand --tabs=1 "${SourceFile}" | wc -L 
# or
  awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"

para

              Expanded    nonexpanded
$'nn\tnn'       10            5

Looks toda a resposta que não dão o número da linha da linha mais longa. Seguinte comando pode dar o número da linha e cerca de comprimento:

$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11

Em perl:

perl -ne 'print ($l = $_) if (length > length($l));' filename | tail -1

isso só imprime a linha, não seu comprimento também.

Aqui estão as referências do anwser

cat filename | awk '{print length, $0}'|sort -nr|head -1

http://wtanaka.com/node/7719

Apenas por diversão, aqui está a versão PowerShell:

cat filename.txt | sort length | select -last 1

E, é só pegar o comprimento:

(cat filename.txt | sort length | select -last 1).Length

Eu estou em um ambiente Unix, e trabalhar com arquivos gzipped que são poucos GBs de tamanho. Eu testei os seguintes comandos usando a 2 GB compactado arquivo com comprimento de registro de 2052.

  1. zcat <gzipped file> | wc -L

e

  1. zcat <gzipped file> | awk '{print length}' | sort -u

Os tempos eram em avarage

  1. 117 segundos

  2. 109 segundos

Aqui está o meu script após cerca de 10 corridas.

START=$(date +%s) ## time of start

zcat $1 |  wc -L

END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"

START=$(date +%s) ## time of start

zcat $1 |  awk '{print length}' | sort -u

END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"

Variação no tema.

Este irá mostrar todas linhas com o comprimento da linha mais longa encontrada no arquivo, mantendo a ordem em que aparecem na fonte.

FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE

Assim myfile

x
mn
xyz
123
abc

dará

xyz
123
abc
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top