Question

J'ai besoin de casser une ligne de chaîne dans différentes colonnes dans Excel. Voici une entrée que je reçois.

Entrée :

  • 37006 II SEMESTER P.G. Diplôme en recherche clinique et examen de la gestion des données cliniques, juillet / août 2012 Délai de réglementation Pharma: 3 heures max. Marques: 100

Sortie : enregistrement CSV avec structure (code, SEM / année, sujet, cours, date d'examen, heure, marques)

  • 37006, II semestre, p.g. Diplôme en recherche clinique et gestion de données cliniques, Affaires réglementaires pharmaceutiques, juillet / août 2012, 3 heures, 100

J'ai des données dans différents ensembles qui construisent ci-dessus les lignes. Par exemple:

grammaire (ceci est un tableau / dictionnaire):

  • semestres [I, II, III, IV, V, VII, VII, VIII, IX, X, 1,2,3,4,5,6,7,8,9,10]
  • ans [I, II, III, IV, V, VI, VII, VIII, IX, X, 1,2,3,4,5,6,7,8,9,10]
  • Sujets [p.g. Diplôme en recherche clinique et gestion des données cliniques, LL.B]
  • Cours [Affaires réglementaires Pharma, Loi - Jurisprudence]
  • examine [juillet / août 2012, janvier/feb. 2013]
  • temps [3 heures]
  • Maxmarks [30,40,50,60,70,80,90.100]

FYI,

  • Je ne suis pas sûr que je puisse utiliser des délimiteurs pour le casser comme son hautement imprévisible ou fiable.
  • Je ne suis pas sûr que le texte soit dans la même commande dans chaque ligne ou aucune longueur ou voitures ou mots fixes

Mon hypothèse est, lisez le mot par mot et essayez de faire correspondre n'importe quel mot dans n'importe quel tableau que j'ai. Si sa correspondance avec n'importe quel mot, classez ensuite ce mot dans la chute de la catégorie et ajouter une colonne pertinente dans Excel.

Ici, je sais comment gérer les données et tout, sauf quel est le moyen optimisé / meilleur de comprendre chaque mot tombe sous quelle catégorie.

Y a-t-il une analyse lexicale qui peut partager certaines réflexions à ce sujet?

Était-ce utile?

La solution

Vous devez utiliser des expressions régulières pour faire correspondre un tel modèle de texte compliqué.

Autres conseils

Veuillez consulter un analyseur lexical comme antlr .Si vous connaissez Java ou d'autres langues qui lisent expressions régulières , vous pourrez l'analyser facilement après un après-midi (ou une semaine) de torture.Vous pouvez également écrire le REGEXP en Java, mais je vous me nourrirais vers l'interface anti-ANTLR, que vous pouvez utiliser depuis Eclipse.Il vous montrera comment les lignes sont analysées.

Demandez à la sortie de l'AntlR ou Java écrivent un fichier CSV.Le CSV sera votre véhicule pour obtenir vos données dans la feuille de calcul Excel.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top