Domanda

incontro spesso messaggi EDI in vari formati di testo, ad esempio il formato:

HEAD[customer,8][date,8][reference,10]
[lineno, 3][product, 8][quantity, 3][currency, 3][price, 10]...

.. con conseguente messaggi come questo:

HEAD1122334420091031   LINDAHL
00100004711010USD0000234055
00200004712005USD0000004543
...

La lettura della discarica di cui sopra richiede ovviamente messa a fuoco, e mi ritrovo spesso a perdere traccia di colonne e campi. Sarebbe bello avere un modo di esprimere la grammatica del messaggio e ottenere un file contrassegnato-up (per esempio in HTML).

Naturalmente è possibile fare questo con gli script su misura in qualsiasi lingua, ma sono curioso: C'è una cosa generica per trasformare il testo normale, qualcosa di simile a ciò che fa XSLT con XML

?
È stato utile?

Soluzione

Sembra un lavoro per awk. E 'stato progettato esattamente per analizzare i file di testo del genere. E 'basato su regole, esattamente come XSLT. E 'già installato sulla propria macchina Unix -. Basta man awk

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top