Pregunta

Me encuentro a menudo mensajes EDI en varios formatos de texto sin formato, por ejemplo, el formato:

HEAD[customer,8][date,8][reference,10]
[lineno, 3][product, 8][quantity, 3][currency, 3][price, 10]...

.. lo que resulta en mensajes como este:

HEAD1122334420091031   LINDAHL
00100004711010USD0000234055
00200004712005USD0000004543
...

lectura de la descarga anterior requiere, obviamente, el enfoque, y muchas veces me encuentro a mí mismo perder la pista de columnas y campos. Sería bueno tener una forma de expresar la gramática del mensaje y conseguir un archivo marcado en marcha (por ejemplo, en HTML).

Por supuesto, es posible hacer esto con guiones a medida en cualquier idioma, pero tengo curiosidad: ¿Hay una cosa genérica para la transformación de texto plano, algo así como lo hace con XSLT XML

?
¿Fue útil?

Solución

Parece un trabajo para awk. Fue diseñado exactamente para analizar archivos de texto por el estilo. Es basado en reglas, exactamente como XSLT. Ya está instalado en su máquina Unix -. Sólo man awk

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top