Pregunta

Hago una aplicación web para cargar un archivo TSV

  1. JDK -> 1.4
  2. Struts -> 1
  3. Resina -> 3.0.9

El archivo tsv analizado con " t", " n", " r"

La validación es.

1. ¿El nombre del archivo está a lo largo de una convención de nombres?

2. ¿Es el archivo TSV?

¿Cómo debo hacer la validación de una imagen u documento de oficina similar al TSV?

¿Fue útil?

Solución

Eso depende de su definición de un archivo TSV.

¿Todos tienen la misma cantidad de columnas? ¿O es posible omitir las últimas columnas vacías?

Si todos tienen la misma cantidad de columnas, puede hacer una primera validación en eso. Si falla, entonces sabe que el archivo no es válido.

¿Todos tienen una fila de encabezado? Si es así, puede usarlo para responder la pregunta anterior y validar el análisis del archivo.

¿Se permite citar? Si es así, ¿se le permite colocar devoluciones o pestañas de carro en las citas? (No necesariamente ayudará en la validación, pero tendrá que pensarlo cuando se analice)

¿Tu texto es estrictamente texto? Puede probar personajes no imprimibles y rechazarlo sobre esa base. Nuevamente tenga cuidado aquí en la codificación de caracteres utilizada para el archivo (UTF vs ASCII, etc.). Esto se puede colocar en el código que realiza el primer análisis de los archivos planos a una estructura de datos (lista de mapa, por ejemplo).

Una mayor perforación en el archivo en sí, si es formato fijo o se sabe que el tipo de algunos datos puede hacer un analizador secundario para validar estos datos (fechas, marcas de tiempo u otras cadenas de formato fijo). Este segundo nivel se puede hacer cuando ha descubierto más sobre el contenido y está procesando los datos de la estructura anterior.

Sin embargo, los anteriores son todo análisis empírico, como tal, debe esperar que caigan falsos positivos, aunque no debe ocurrir un falso negativo si elige reglas para las cuales sus archivos de entrada deben adherirse. Por lo tanto, a lo largo de la pila de procesamiento, espere encontrar datos no válidos y estar preparado para invalidar la entrada completa del archivo, en otras palabras, nunca asume que las pruebas realizadas dan una garantía completa de que el archivo es correcto.

Espero que esto ayude.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top