Question

Je n'ai pas trouvé de réponse à cette question particulière; peut-être qu'il n'y en a pas. Mais cela fait un moment que je me pose des questions.

Qu'est-ce qui provoque exactement l'affichage d'un fichier binaire sous la forme "charabia"? quand vous le regardez dans un éditeur de texte? C'est la même chose avec les fichiers cryptés. Les valeurs binaires du fichier essaient-elles d'être converties en ASCII? Est-il possible de convertir la vue pour afficher des valeurs binaires brutes, c'est-à-dire les 1 et les 0 qui composent le fichier?

Enfin, existe-t-il un moyen de déterminer quel programme ouvrira correctement un fichier de données? Plusieurs fois, en particulier avec Windows, un fichier est orphelin ou n'est pas associé à un programme particulier. L'ouvrir dans un éditeur de texte vous indique parfois à quel endroit il appartient, mais la plupart du temps, ce n'est pas le cas, à cause du charabia. Si l'extension ne fournit aucune information, comment pouvez-vous déterminer le programme auquel elle appartient?

Était-ce utile?

La solution

  • Les valeurs binaires du fichier tentent-elles d'être converties en ASCII?

Oui, c'est exactement ce qui se passe. En règle générale, les valeurs binaires du fichier incluent également des caractères de contrôle ASCII qui ne sont pas imprimables, ce qui entraîne un affichage encore plus étrange dans un éditeur de texte classique.

  • Est-il possible de convertir la vue pour afficher des valeurs binaires brutes, c'est-à-dire pour montrer les 1 et les 0 qui composent le fichier?

Cela dépend de votre éditeur. Ce que vous voulez, c'est un "éditeur hexadécimal", plutôt qu'un éditeur de texte normal. Cela vous montrera le contenu brut du fichier (généralement en hexadécimal plutôt que binaire, car les zéros et les uns prendraient beaucoup de place et seraient plus difficiles à lire).

  • Enfin, existe-t-il un moyen de déterminer quel programme s'ouvrira correctement? un fichier de données?

Il existe un programme de ligne de commande Linux appelé "fichier" et qui essayez d'analyser le fichier (généralement à la recherche de modèles d'en-tête communs) et de vous indiquer le type de fichier (par exemple, du texte, de l'audio, de la vidéo ou du XML, etc.). Je ne sais pas s'il existe un programme équivalent pour Windows. Bien sûr, la sortie de ce programme n’est qu’une estimation, mais elle peut être très utile si vous ne connaissez pas le format d’un fichier.

Autres conseils

Un fichier binaire apparaît sous forme de charabia, car ses données sont conçues pour être lues par la machine et non par des humains. Malheureusement, certains d’entre nous s’habituent à interpréter le charabia - bien qu’avec des outils assez spécialisés pour aider à mieux visualiser les données - mais la plupart des gens ne devraient pas avoir besoin de savoir.

Chaque octet du fichier est traité comme un caractère du jeu de codes actuel (probablement le CP1252 sous Windows). La valeur d'octet 65 est "A", par exemple; vous pouvez trouver facilement des exemples illustratifs sur le Web. Ainsi, les octets qui composent les données binaires sont affichés en fonction du code défini - du mieux que l’éditeur de texte peut. Il n'essaye pas de convertir le binaire - il ne sait pas comment faire (seul le programme original le sait).

Pour déterminer quel programme a créé le fichier, vous pourrez peut-être le faire de temps en temps, mais sans difficulté ni facilité. Sous Unix (ou avec Cygwin sous Windows), le programme 'fichier' pourra peut-être vous aider. Ce programme examine les premiers octets pour essayer de deviner le programme.

Les données cryptées sont supposées ressembler à du charabia. Si cela ne ressemble pas à du charabia, alors il n’est probablement pas très bien crypté.

Les fichiers de raison qui sont binaires sont affichés sous forme de charabia lorsqu’ils sont affichés dans des éditeurs de texte standard tels que le bloc-notes, car, lorsqu’ils sont affichés avec les codages couramment utilisés par ces types d’application (par exemple, ASCII de UTF-8), les données sont mappées en caractères lorsque il est codé pour l'affichage, la sortie de ce processus n'a généralement pas plus de sens pour les humains que les données binaires cartographiées, par conséquent, le charabia que vous voyez

Comme mentionné précédemment, ces fichiers ont plus de sens lorsqu'ils sont visualisés différemment, comme avec un éditeur hexadécimal.

Certains types de fichiers peuvent être reconnus par les données présentes dans tous les fichiers d'un type donné, par exemple tous les fichiers exécutables (* .exe) commencent par les lettres MZ

L’affichage semble intéressant car un fichier binaire peut contenir des caractères non imprimables. Il appartient au programme qui s’affiche de remplacer ces caractères par quelque chose d’autre.

Ceci peut être évité en utilisant un éditeur hexadécimal. Un tel programme affiche chaque octet du fichier en tant que valeur hexadécimale. Cela donne une belle vue tabulaire du fichier, mais il n’est pas facile pour une personne moyenne de déchiffrer cette vue, car nous n’avons pas l'habitude de regarder les données de cette façon.

Il existe plusieurs façons de savoir à quel programme un fichier peut appartenir. Vous pouvez regarder le début du fichier et, avec certaines connaissances, vous pourriez reconnaître le type de fichier. Certains types commencent par les mêmes caractères (RAR, GIF, etc.). Pour les autres types, cela pourrait ne pas être aussi facile.

Sous Linux, vous pouvez utiliser le "fichier". commande pour vous aider à déterminer le type de fichier. Il existe probablement des programmes pour Windows qui feront de même.

Les données binaires sont souvent très aléatoires. Données cryptées en particulier, par définition. Chaque octet peut être représenté par l'un des 256 caractères (en laissant Unicode en dehors de l'équation). ASCII ne couvre que 128 d'entre eux, et seulement 94 d'entre eux sont des caractères imprimables. En dehors de la plage ASCII, vous avez un certain nombre de caractères internationaux et de symboles étranges. Il y en a certainement plus de 128, il faut donc spécifier une page de code pour sélectionner un ensemble spécifique de symboles.

Quoi qu'il en soit, comme les fichiers binaires peuvent être représentés comme un assortiment très aléatoire de caractères familiers et inconnus, le fichier ressemblera à du charabia si vous l'ouvrez dans un éditeur.

Vous pouvez toujours ouvrir un fichier (un fichier binaire ou texte, il n'y a vraiment aucune différence) dans un éditeur hexadécimal, et consulter les données binaires brutes.

Il n’existe aucun moyen de savoir quel programme a créé un fichier spécifique. En particulier, si le programme a crypté ses données, tout espoir est perdu. Sinon, il est souvent facile de reconnaître certaines "signatures".

Oui, Wordpad and Notepad, ainsi que de nombreux autres éditeurs de texte, supposent que tout fichier ouvert avec ce fichier est un fichier texte et essaiera d’afficher les caractères ASCII représentés par les octets du fichier.

Les

Hex Editors sont conçus pour afficher et modifier des fichiers binaires. Ils affichent généralement chaque octet sous forme d'une paire de chiffres hexadécimaux au lieu de "1 et 0". car il est plus facile de lire de cette façon.

Un éditeur de texte émet très peu d'hypothèses sur les données qui y sont entrées, mis à part des choses comme l'encodage des caractères. Ainsi, il lira (comme vous le dites) les données du fichier au format ASCII et les affichera de cette façon. Puisque les données binaires ne tombent pas toujours dans la plage alphanumérique, vous obtenez du charabia. Pour afficher les valeurs binaires brutes, vous avez besoin d’un éditeur hexadécimal tel que XVI32 .

Les fichiers binaires n'ont souvent pas de contexte en dehors du programme qui les utilise. Certains formats binaires contiennent au début une séquence magique de 4 octets (par exemple, les fichiers .class Java commencent par "CAFE"), mais pour les reconnaître sans leur programme, vous avez besoin d'un mappage de ces séquences de 4 octets. Je pense que certaines distributions Linux contiennent ces informations pour une grande variété de formats binaires et examineront le début du fichier pour tenter de l'identifier. En dehors de cela, vous ne pouvez pas faire grand chose.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top