Pourquoi Google Wave opérationnelle Transformer les annotations ont besoin?

StackOverflow https://stackoverflow.com/questions/4085847

  •  28-09-2019
  •  | 
  •  

Question

Les choses transformation opérationnelle utilisée dans Google Wave a un format de document assez curieux. Un document est fondamentalement juste un document sous-ensemble xml - caractères, balises de début et de fin. En plus de cela, le document a « annotations », qui sont des méta-données associées à des gammes, par exemple Position de début et de fin. Le livre blanc justifie leur présence avec:

  

opérations de documents d'onde prennent également en charge les annotations. Une annotation est des méta-données associées à une plage d'article, à savoir une position de départ et une position finale. Ceci est particulièrement utile pour décrire le texte mise en forme et des suggestions d'orthographe, car elle ne complique pas unecessarily le format de document structuré sous-jacent.

Je peux certainement voir comment il serait un peu difficile si une gamme arbitraire d'un document sera sélectionné et par exemple en gras -. Imbrication de balise XML est stricte et que causerait un gâchis d'insertions de tag ouvrir et fermer

Cependant, est-ce vraiment un problème dans la pratique? Je veux dire, est-on nécessairement soutenir cette opération, sinon faire un éditeur qui imite essentiellement les années vieux paradigme traitement de texte au lieu d'être un éditeur structuré? Transformeraient opérationnelle XML pur avec la structure du document comme une simple HTML5 être terrible? Est-ce un problème de performance que les styles seraient dans le document en tant que balises? Ou le modèle opérationnel de transformer produire des résultats peu satisfaisants en quelque sorte le formatage du texte si elles sont représentées avec des balises?

En outre, une question secondaire - à quel point serait le pur « caractère d'insertion, le caractère de supprimer, conserver » modèle de transformation opérationnel soit sur les représentations de texte en clair? Par exemple, l'édition HTML5 sous forme de texte - ou la modification d'articles de Wikipedia

Était-ce utile?

La solution

Il y a des problèmes fondamentaux avec l'aide d'un langage de balisage hiérarchique avec OT. Voir ci-dessous un exemple chiffré:

Est-ce que travaux de transformation opérationnelle sur des documents structurés tels que HTML si simplement traité comme texte brut

Autres conseils

Ce choix me sens comme une optimisation sur plusieurs fronts:

  • Le document sous-jacent reste que lisible par l'homme et parse-mesure possible
  • Les algorithmes pour analyser le XML sous-jacent reste aussi simple que possible (utile pour la compatibilité avec les tentatives non-Google à l'analyse des documents obtenus, et pour l'entretien)
  • Les déchets collectés supplémentaires, après plusieurs modifications, peut conduire à de grands problèmes de performances -. En raison du grand nombre de balises et / ou des passages supplémentaires sur le document pour tenter de le simplifier
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top