Domanda

Devo suddividere una riga di stringa in diverse colonne in Excel.Ecco l'input che ricevo.

Ingresso:

  • 37006 II Semestre P.G.Diploma in Esame di ricerca clinica e gestione dei dati clinici, luglio/agosto 2012 Affari regolatori farmaceutici3 ore al massimoSegni :100

Produzione:Record CSV con struttura (Codice, Sem/Anno, Materia, Insegnamento, Data esame, Ora, Voto)

  • 37006, II Semestre, P.G.Diploma in ricerca clinica e gestione dei dati clinici, affari regolatori farmaceutici, luglio/agosto 2012, 3 ore, 100

Ho dati in diversi set che costruiscono sopra le righe.Per esempio:

Grammatica (questo è un array/dizionario):

  • Semestri[I,II,III,IV,V,VI,VII,VIII,IX,X,1,2,3,4,5,6,7,8,9,10]
  • Anni[I,II,III,IV,V,VI,VII,VIII,IX,X,1,2,3,4,5,6,7,8,9,10]
  • Soggetti[P.G.Diploma in ricerca clinica e gestione dei dati clinici, LL.B]
  • Corsi[Affari regolatori del settore farmaceutico,Diritto - Giurisprudenza]
  • Date degli esami[luglio/agosto 2012, gennaio/febbraio2013]
  • Tempo[3 ore]
  • MaxMarchi[30,40,50,60,70,80,90,100]

PER TUA INFORMAZIONE,

  • Non sono sicuro di poter utilizzare alcun delimitatore per interromperlo poiché è altamente imprevedibile o affidabile.
  • Non sono sicuro che il testo sarà nello stesso ordine in ogni riga o senza lunghezza fissa, macchine o parole

La mia ipotesi è, leggere parola per parola e provare ad abbinare qualsiasi parola in qualsiasi array che ho.Se corrisponde a qualsiasi parola, classifica quella parola nella categoria cadente e aggiungila nella colonna pertinente in Excel.

Qui, so come gestire i dati e tutto il resto, tranne quello che è il modo ottimizzato / migliore per capire ogni parola rientra in quale categoria.

C'è qualche esperto di analisi lessicale che può condividere qualche pensiero al riguardo?

È stato utile?

Soluzione

Dovresti usare le espressioni regolari per abbinare modelli di testo così complicati.

Altri suggerimenti

Dai un'occhiata a un analizzatore lessicale come ANTLR.Se conosci Java o altri linguaggi che leggono espressioni regolari, sarai in grado di analizzarli facilmente dopo un pomeriggio (o una settimana) di torture.Puoi anche scrivere l'espressione regolare in Java, ma ti suggerirei di orientarti verso l'interfaccia ANTLR, che puoi utilizzare da Eclipse.Ti mostrerà come vengono analizzate le linee.

Chiedi all'output di ANTLR o Java di scrivere un file CSV.Il CSV diventerà il tuo veicolo per inserire i tuoi dati nel foglio di calcolo Excel.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top