Pouvez-vous cacher des données dans du texte?

https://stackoverflow.com/questions/345562

19-08-2019
|

Question

Je souhaite mettre du texte sur une page et masquer des données dans ce texte. Est-ce que quelqu'un connaît des méthodes / modèles qui ont été utilisés dans le passé pour résoudre ce problème?

Exemple: j'ai le texte suivant: "Le chat était assis sur le chien et était heureux."

J'ai également le numéro 123. Je souhaite masquer ce numéro dans cette phrase afin que celle-ci puisse être placée sur une page Web et que seul un expert puisse retrouver les données.

La solution

HTML facilite la tâche, en fait. Pas besoin de rudimentaires stganographies, etc. Voyons voir:

Cette phrase incorpore 123, puis arrête l'incorporation.

Cette phrase incorpore 0102 puis arrête l'incorporation.

(Nous devrons voir si cela fonctionne réellement dans Markdown, mais je suppose que oui.) Certes, il est assez évident que vous sachiez qu'il y a quelque chose à rechercher, mais je pense que vous convenez que ce n’est pas évident pour les observateurs occasionnels.

Je vous ai laissé un casse-tête pour élaborer le schéma, mais ajoutez un commentaire si vous souhaitez qu'il soit explicitement expliqué.

Autres conseils

Bien sûr, cela peut être fait.

Ce que vous décrivez se trouve dans une description générale appelée stéganographie .

Par exemple, vous pouvez coder un nombre de manière à compter le nombre de mots jusqu'à ce que vous voyiez la lettre B. Dans ce cas, 123 pourrait être codé comme suit:

You belong to the beautiful group of people being elite.

Le problème, c’est que la personne qui souhaite décoder votre message doit connaître votre algorithme.

Modifier Je remarque que mes chiffres sont décalés de un. Commencez à compter à 0 et vous verrez le nombre 123.

Il existe des approches très complexes à ce problème, mais vous pouvez probablement en choisir une très simple. Par exemple. définir un adjectif pour chaque nombre:

0. beautiful
1. harmless
2. evil
3. colorful
4. weird

et ainsi de suite. Maintenant, sélectionnez les phrases de votre choix et placez des espaces réservés dans les phrases auxquelles appartiennent les adjectifs.

"The {adj} cat sat on the {adj} dog and the {adj} cat was happy."

Votre numéro est 123, votre phrase est donc

"The harmless cat sat on the evil dog and the colorful cat was happy."

Un analyseur syntaxique peut facilement prendre la phrase, la scinder en mots, trouver les adjectifs dans le tableau ci-dessus et les reconvertir en nombres.

The -> ?
harmless -> 1
cat -> ?
sat -> ?
on -> ?
the -> ?
evil -> 2
:

à la fin, vous avez encore 123.

Dès que les gens sachent que des informations sont cachées dans la phrase, l'algorithme est facilement cassé. Vous pouvez rendre la tâche plus difficile si vous ajoutez une variation en définissant plusieurs adjectifs par nombre. Au lieu de

1. harmless

vous pouvez définir

1. harmless/stupid/blue/fashionable

lorsque vous devez coder 1, choisissez au hasard l'un des mots ci-dessus. Comme ils correspondent tous au numéro 1, l'analyseur inverse ne se souciera pas de savoir quel mot est imprimé ici, le résultat sera toujours un. Cette randomisation rendra plus difficile l’ingénierie inverse de l’algorithme.

Je pense qu’à un niveau élevé, vous parlez de la stéganographie. http://fr.wikipedia.org/wiki/Steganography

La section sur les techniques modernes devrait vous aider à démarrer: http://fr.wikipedia.org / wiki / stéganographie # Modern_steganographic_techniques

Je pense que ce que vous recherchez, c'est ce qu'on appelle la stéganographie. Corinna John possède une excellente collection d'articles sur le sujet dans CodeProject.

http://www.codeproject.com/script/Articles /MemberArticles.aspx?amid=475133

Il est possible qu'un algorithme puisse transformer cette phrase en 123, mais je pense qu'en général, vous devrez accepter certaines modifications du texte si vous devez stocker une valeur numérique possible!

Si le 'texte' est en réalité une image, vous pouvez masquer des données en utilisant stéganographie - les données sont cachées dans le fichier image binaire sans affecter l'apparence de l'image.

Selon ce fil :

Prof. Mikhail Atallah et. Al. Chez Purdue, nous avons effectué de nombreuses recherches sur le texte de marquage en filigrane .

Cette approche utilise des RTM ( signification du texte Représentation ) de phrases pour coder des bits en effectuant des transformations mineures positionnant la TMR à une certaine distance d’une forme canonique définie.

(une autre méthode de filigrane est

L’approche mentionnée par Jon Skeet est très similaire à celle de Matthew Kwan, SNOW . ; approche. Les deux masquent de petites quantités d'informations arbitraires dans le texte sans ajouter, supprimer ou modifier les mots du texte source. Les deux encodent le message secret dans des espaces normalement non pertinents et normalement invisibles - espace supplémentaire et caractères de tabulation entre les mots et aux extrémités des lignes.

Voici un prototype convertissant des données cryptées en "naturel". message texte.

http://herosys.net/w/ projet / texte-stéganographie-masquer-texte-dans-spam-sms

Convertissez le texte source tel que "Voir U à la porte est de l’Université, demain à 8 heures". raccourcir le message texte ressemble à un spam.

"Meilleure maison de tous les temps!" vous ne devriez jamais le manquer. 1000-3000 pieds carrés. 15-80 $ par pied carré. Composez le 123-456-7890 ".

L’algorithme consiste à créer un diagramme de grammaire et à créer un tableau candidat pour chaque mot. Tout comme BASE64, mais la table d'index est modifiée en fonction de votre contexte prédéfini.

Eh bien, vous pouvez essayer quelque chose comme ceci ... ne savez pas si c'est exactement ce que vous êtes à la recherche, cependant.

J'ai deux systèmes avec une bonne sécurité mais avec le compromis de taux d’incorporation stegabit assez bas. L’un d’eux est extrêmement simple mais a un taux d’incorporation de 1 bit par ligne de textes arbitraires donnés par l’utilisateur, tandis que l’autre, obligeant l’utilisateur à composer des textes de couverture sous la direction du logiciel, atteint un taux d’incorporation compris entre , 1,0] par mot. Voir ma page d'accueil mok-kong-shen.de

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow