editor de texto para grande aberto (, enormes, grandes gigantes) arquivos de texto [fechado]

https://stackoverflow.com/questions/159521

03-07-2019
|

Pergunta

I média 100+ MB grande; esses arquivos de texto pode empurrar o envelope de editores.

Eu preciso olhar através de um grande arquivo XML, mas não podem se o editor é buggy.

Todas as sugestões?

Solução

Código VS (Windows, MacOS, Linux) - Livre e Código Aberto com um bom GUI. Editado um ficheiro de 3,6 GB JSON, carregado em um minuto. Você deve ter memória RAM suficiente para carregar os arquivos.

Free somente leitura telespectadores:

glogg (Windows, MacOS, Linux) - Confirmado para lidar com arquivos de multi-GB. Sua principal característica é pesquisa de expressão regular. Tem abas, lê arquivos diretamente do disco, pode assistir / siga arquivos, e permite que o usuário linhas de marca.
LogExpert (Windows) - "substituição Uma GUI para tail." Suportes seguinte arquivo, pesquisa, filtragem, realce de configurável, plugins e ferramentas externas.
arquivo de texto grande Visualizador (Windows) - minimalista e tem tamanho executável muito pequena. Apoia a opinião de divisão, de personalização tema texto, busca regex, e de arquivo seguinte.
Lister (Windows) - Ainda mais pequeno e minimalista. É um executável, apenas 500 KB, mas ainda oferece suporte à pesquisa (com expressões regulares), a impressão, o modo editor hexadecimal, e configurações.

editores gratuitas:

Vim e Emacs (Windows, MacOS, Linux) - editores clássico Unix. curva de aprendizado íngreme, mas brutalmente eficiente. Eles têm configurações que podem ser ajustados para torná-los ainda mais rápido.
Grande Arquivo (Windows) - Abre e edições TB + arquivos, suporte a Unicode, usa pouca memória, tem características específicas em XML, e inclui um modo binário.
HxD (Windows) - Um editor hexadecimal, não um editor de texto; mas é incrivelmente rápido e útil.
GigaEdit (Windows) - suporta a busca, estatísticas de caracteres, e personalização fonte. Mas é de buggy - com arquivos grandes, que só permite substituir caracteres, não inseri-los; não respeita LF como um terminador de linha, apenas a CRLF; e é lento.

programas Builtin (não requer instalação):

menos (MacOS, Linux) - A ferramenta pager tradicional Unix de linha de comando. Permite visualizar arquivos de texto de praticamente qualquer tamanho. Pode ser instalado no Windows, também.
Bloco de notas (Windows) - Decent com arquivos grandes, especialmente com quebra automática desligada.
MAIS (Windows) - Refere-se ao MORE do Windows , não o Unix more. Um programa de console que permite visualizar um arquivo, uma tela de cada vez.

telespectadores da Web:

htmlpen.com - é possível abrir e + arquivos de sintaxe de destaque TB. Permite a edição, exceto para arquivos muito grandes. Suportes procura, expressões regulares e exportadores.
readfileonline.com - Outra grande visualizador de arquivos HTML5. procurar apoios.

editores pagos:

010 Editor (Windows, MacOS, Linux) - Abre gigante (até 50 GB) arquivos.
SlickEdit (Windows, MacOS, Linux) -. Abre arquivos grandes
UltraEdit (Windows, MacOS, Linux) - arquivos Abre de mais de 6 GB, mas a configuração deve ser alterada para que isso seja prático: menu »avançada» configuração »Manipulação de arquivos» arquivo arquivos temporários »Open sem arquivo temporário ...
EmEditor (Windows) - lida muito grandes arquivos de texto bem (oficialmente a 248 GB, mas, tanto quanto 900 GB de acordo com um relatório).

E, finalmente, você já tentou abrir o arquivo grande com seu editor regular? Alguns editores podem realmente lidar com arquivos razoavelmente grandes. Em particular, Notepad ++ (Windows) e texto Sublime (Windows, MacOS, Linux) arquivos de suporte na faixa de 2 GB.

Outras dicas

Dicas e truques

menos

Por que você está usando editores apenas olhar em um arquivo (grande)?

De acordo com * nix ou Cygwin , basta usar menos . (Há um famoso ditado - "menos é mais, mais ou menos." - porque "menos" substituiu o comando antes do Unix "mais", com a adição de que você poderia rolar para cima) Pesquisando e navegando sob menos é muito semelhante ao Vim, mas não há nenhum arquivo de swap e pouca RAM usado.

Há uma porta Win32 do GNU menos. Consulte a seção "menos" da resposta acima.

Perl

Perl é bom para scripts rápidos, e sua .. (intervalo flip-flop) operador faz para um mecanismo de seleção bom para limitar o crud você tem que percorrer.

Por exemplo:

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

Isto irá extrair tudo de linha 1 milhão para a linha 2 milhões, e permitem que você filtrar a saída manualmente em menos.

Outro exemplo:

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

Isso inicia a impressão quando o "um expressão regular" encontra algo, e pára quando a "expressão regular dois" encontrar o fim de um bloco interessante. Pode encontrar vários blocos. Peneire a saída ...

LogParser

Esta é outra ferramenta útil que você pode usar. Para citar artigo de Wikipedia :

LogParser é um utilitário de linha de comando flexível que foi inicialmente escrito por Gabriele Giuseppini, um funcionário da Microsoft, para automatizar testes de log do IIS. Ele foi projetado para uso com o sistema operacional Windows, e foi incluído com o 6.0 Resource Kit Tools IIS. O comportamento padrão do LogParser funciona como um "processamento de dados pipeline", tomando uma expressão SQL na linha de comando, e produzir as linhas contendo partidas para a expressão SQL.

Microsoft descreve Logparser como um poderoso e versátil ferramenta que fornece acesso de consulta universal a dados baseados em texto, como arquivos de log, arquivos XML e arquivos CSV, bem como fontes de dados chave sobre o sistema operacional Windows, como o log de eventos, o registro, o sistema de arquivos, e Active Directory. Os resultados da consulta de entrada podem ser custom-formatado em saída de texto com base, ou eles podem ser mantidos para mais alvos de especialidade como SQL, SYSLOG, ou um gráfico.

Exemplo de utilização:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

A relatividade de tamanhos

100 MB não é muito grande. 3 GB está ficando meio grande. Eu costumava trabalhar em uma instalação de impressão e correio que criou cerca de 2% dos EUA correio de primeira classe. Um dos sistemas para os quais eu era o líder técnico responsável por cerca de 15 +% das peças de correio. Tivemos alguns grandes arquivos para depuração aqui e ali.

E mais ...

Sinta-se livre para adicionar mais ferramentas e informações aqui. Esta resposta é uma comunidade wiki por uma razão! Nós todos precisamos mais conselhos sobre como lidar com grandes quantidades de dados ...

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow