Frage

Ich muss eine Schnurzeile in verschiedene Säulen in Excel brechen. Hier ist Te eingegeben, dass ich bekomme.

input :

  • 37006 II Semester P.G. Diplom in der klinischen Forschung und in der klinischen Datenverwaltung, Juli / August 2012 Pharma-regulatorische Angelegenheiten derzeit: 3 Stunden max. Markierungen: 100

Ausgabe : CSV-Datensatz mit Struktur (Code, SEM / Jahr, Subjekt, Kurs, Prüfungsdatum, Zeit, Markierungen)

  • 37006, II Semester, P.G. Diplom in der klinischen Forschung und in der klinischen Datenverwaltung, in Pharmaregulatorische Angelegenheiten, Juli / August 2012, 3 Stunden, 100

Ich habe Daten in verschiedenen Sets, die über Linien konstruiert. Zum Beispiel:

Grammatik (Dies ist ein Array / Wörterbuch):

  • Semester [I, II, III, IV, V, VI, VII, VIII, IX, X, 1,2,3,4,5,6,4,9,10)
  • Jahre [I, II, III, IV, V, VI, VII, VIII, IX, X, 1,2,3,4,5,6,4,9,2,10)
  • Probanden [p.g. Diplom in der klinischen Forschung und in der klinischen Datenverwaltung, ll.b]
  • Kurse [Pharma regulatorische Angelegenheiten, Recht - Jurisprudenz]
  • Exampeln [Juli / August 2012, Jan./FEB. 2013]
  • Zeit [3 Stunden]
  • MaxMarks [30,40,50,60,60,70,80,90,100]

fyi,

  • Ich bin nicht sicher, dass ich keine Trennschlüsse verwenden kann, um sie als äußerst unvorhersehbar oder zuverlässig zu brechen.
  • Ich bin nicht sicher, dass der Text in jeder Linie in derselben Reihenfolge oder nicht in derselben Reihenfolge oder keiner Festlänge oder -wörter oder Wörtern ist

Meine Annahme ist, das Wort mit Word lesen und versuchen, mit einem beliebigen Wort in jedem Array zusammenzupassen, das ich habe. Wenn es mit jedem Wort übereinstimmt, kategorisieren Sie dieses Wort in fallende Kategorie und fügen Sie in Excel in relevante Spalte hinzu.

Ich weiß hier, wie man mit Daten und alles umgehen soll, außer was ist der optimierte / beste Weg Verstehen Sie jedes Wort Falls in welcher Kategorie.

Gibt es einen lexikalischen Analyse-Experten, der einige Gedanken dazu teilen kann?

War es hilfreich?

Lösung

Sie sollten regelmäßige Ausdrücke zum Anpassen eines solchen komplizierten Textmusters verwenden.

Andere Tipps

Bitte werfen Sie einen Blick auf einen lexikalischen Analysator wie Antlr .Wenn Sie Java oder andere Sprachen kennen, die reguläre Ausdrücke lesen, können Sie diese mit Leichtigkeit nach einem Nachmittag (oder einer Woche) von Folter analysieren.Sie können den RegexP auch in Java schreiben, aber ich würde Sie in Richtung der Antlr-Schnittstelle nennen, die Sie von Eclipse verwenden dürfen.Es zeigt Ihnen, wie die Zeilen analysiert werden.

Die Ausgabe des Antlr oder Java schreibt eine CSV-Datei aus.Der CSV wird Ihr Fahrzeug, um Ihre Daten in die Excel-Tabelle zu erhalten.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top