Pourquoi les articles techniques en texte brut incluent-ils souvent des termes entre guillemets et guillemets?

StackOverflow https://stackoverflow.com/questions/1432952

  •  07-07-2019
  •  | 
  •  

Question

J'aime enregistrer des copies locales de pages contenant beaucoup de texte sur le Web afin de pouvoir améliorer leur apparence en modifiant le balisage pour inclure CSS.

J'ai remarqué qu'un texte sur les pages est souvent délimité par `et '.

Y a-t-il une bonne raison à cela? Je voudrais faire mes modifications automatiquement avec un script si je pensais que ces citations étaient là pour une bonne raison. Est-ce, par exemple, un sous-produit d'un outil de création particulier?

J'ai essayé de rechercher ceci, mais les moteurs de recherche le traitent comme des chaînes vides ou incomplètes et ne donnent pas de résultats significatifs.

Un exemple de citation unique (`') peut être trouvé dans la page de Eric Raymond Cathédrale et le bazar :

  

Le problème était le suivant: supposons que quelqu'un nommé "joe" sur locke m'envoie un courrier. Si je récupérais le courrier et essayais d'y répondre, mon expéditeur essaierait volontiers de l'envoyer à un `joe 'inexistant sur snark. Les adresses de réponses rédigées manuellement sur «@ ccil.org» sont rapidement devenues une véritable douleur.

Était-ce utile?

La solution

L’exemple de l’essai d’Eric Raymond est un exemple typique de personnes de l’époque pré-Unicode qui tentaient «d’améliorer» le typographe de leur texte en utilisant des conventions qui ne tiennent plus. Le style de citation `' est typique de cela. Il est également utilisé dans LaTeX (qui le convertit automatiquement pour corriger les guillemets simples typographiques ‘’ ).

Vous pouvez également voir d'autres artefacts ASCII dans l'essai: par exemple, il utilise “ - ” au lieu d'un tiret “correct” “ - ” (un beaucoup de gens le font, car le tiret n'existe pas sur les claviers Windows par défaut).

En tant que tel, c’est un anachronisme à une époque où la prise en charge des polices Unicode (ou en général: les polices dépourvues de ces caractéristiques typographiques) n’était pas généralisée.

Autres conseils

HTML non. Seuls les caractères ' et "" peuvent être utilisés pour délimiter les valeurs d'attributs (qui sont les seules chaînes pouvant être délimitées en HTML).

Les personnes qui écrivent du texte (qui est balisé en HTML) peuvent utiliser «,», ‘et’, mais il s’agit simplement d’écrire avec des guillemets.

Ce style de guillemets est un style de citation (dans les fichiers texte) accepté depuis avant le Web. Cela n’a rien à voir avec le langage HTML en particulier - il est acceptable dans les fichiers texte HTML, mais il est antérieur au langage HTML.

Ceci:

  

supposons que quelqu'un nommé `joe '

est une affectation visuelle pour les guillemets intelligents qui fonctionne dans les environnements uniquement ASCII.

Personnellement, je ne le recommanderais pas du tout. `n’est pas une citation ouverte, c’est un accent grave, et l’abondance des citations qui en résulte est, à mon goût, bien pire que d’utiliser simplement des« citations droites ». `` Double faux-quotes " sont encore plus laids.

Vous trouverez des Allemands en train de taper de fausses citations malignes en utilisant à la fois les caractères d’accentuation grave et aigu: `like this & # 180 ;. Ce n'est pas compatible ASCII (il utilise un caractère étendu ISO-8859-1) et reste assez moche, mais ils le font parce que les caractères d'accent sont présents sur la disposition de clavier allemande, ce qui les rend faciles à taper. (Et ils ne savent pas mieux.)

Vraiment, nous devrions avoir les "& # 8216; citations intelligentes" appropriées # # 8217; disponible & # 8220; sur le clavier & # 8221; pour & # 171; direct & # 187; dactylographie. Cela résoudrait ces problèmes et bannirait les fausses fonctionnalités auto-devis automatisées, y compris la fonctionnalité stupide StackOverflow qui gâcherait le titre de votre question & # 8121; & # 8201; retour au début bitbucket où ils appartiennent. (Bien qu'en réalité ... j'ai déjà .)

Je pense qu'il s'agit d'un artefact de votre éditeur. Vous avez peut-être activé les guillemets intelligents. Les chaînes en HTML sont délimitées par une paire de guillemets simples ou doubles, et non par des guillemets intelligents.

Ni HTML4 , ni HTML5 permet les guillemets bouclés comme délimiteurs de valeur d'attribut dans le balisage. Recherche de " citations frisées html " dans les moteurs de recherche, quelques pages apparaissent, dont la première Curling Quotes in HTML, XML et SGML décrivent certains outils permettant de supprimer les guillemets erronés. C’est le contraire de ce que vous demandez, mais ce qu’il faut faire avec de tels fichiers.

Votre commentaire indique que vous entendez par backtick et citation dans le texte plutôt que dans le balisage. C'était un style assez courant sur usenet à l'époque, car backtick est en ASCII mais pas les guillemets bouclés. Pour insérer une backtick dans votre texte, appuyez sur la touche Backtick de votre clavier lors de la saisie.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top