Pregunta

Tengo esta aplicación web que necesita realizar varias tareas de procesamiento de texto: eliminar ciertos caracteres, analizar archivos XML, entre otros. Algunos de ellos implican expresiones regulares.

La aplicación web tiene algunas implementaciones en Java y otras en PHP. ¿Vale la pena usar Perl u otro lenguaje de procesamiento de texto específico para dichas tareas, o realmente no hay diferencia con el uso de PHP?

Incluso pensé en usar Sed, Awk, tal vez incluso algunos scripts C compilados para procesar textos. Hay mucho texto para ser procesado ...

¿Fue útil?

Solución

Sí, Perl es una buena opción. Como lenguaje, es definitivamente más adecuado para ese tipo de tareas que Java o PHP. Si tiene el conocimiento de Perl, lo recomendaría para este tipo de tarea.

Otros consejos

Yo también te sugiero que uses Perl, está hecho para procesar textos.

Sin embargo, si va a analizar / procesar XML, no intente utilizar su propia solución, hay varios módulos de alta calidad que hacen el trabajo correctamente. Para empezar, te recomiendo que eches un vistazo a XML :: Twig

También, para expresiones regulares, hay docenas de ya hechas bajo Regexp :: Common distribution. Probablemente encontrará lo que necesita allí y le ahorrará tiempo.

Perl es el lenguaje para el procesamiento de texto. Fue diseñado con esto en mente.

El procesamiento de texto es exactamente para lo que se creó Perl. Después de todo es Práctica Extracción y Lenguaje de Informes. Por otro lado, para la aplicación web preferiría Python.

Sí, Perl fue diseñado con el procesamiento del texto en mente.

Tiene toneladas de útiles funciones de procesamiento de texto, y fue el primer idioma que utilicé (hace mucho tiempo) el que tenía expresiones regulares.

http://en.wikipedia.org/wiki/Perl

Sí. El procesamiento de texto es el punto fuerte # 1 de PERL. Ya que se integrará en su aplicación existente, deberá ejecutar un programa externo, así que piense cómo ejecutarlo de manera segura y tal vez como un proceso en segundo plano (para evitar retrasos en el inicio de su aplicación web en tiempo real).

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top