¿Qué sistema de base de datos gratuito es mejor almacenar, y calcular / analizar comparaciones de texto grandes de las cuales la base de datos haría estadísticas útiles? [cerrado]

StackOverflow https://stackoverflow.com/questions/202715

  •  03-07-2019
  •  | 
  •  

Pregunta

Pude crear un script que compararía miles de textos grandes (entre ellos). Y me pregunto si MySQL es la mejor solución para esto. ¿Hay algún otro sistema de base de datos gratuito que pueda usar para hacer una computación simple, pero que requiera mucho tiempo de procesamiento?

¡Por favor, arrójame al grupo de tus conocimientos!

Editar: Naturaleza de los documentos: 500-7000 documentos de caracteres, - > comparar los documentos si el texto coincide con el otro documento (plagio) y estadísticas - > % de coincidencia de cualquier oración encontrada con configuraciones agradables como la que me gustaría establecer cuántos caracteres la otra cadena podría ser diferente para que aún se considere una coincidencia ...

La tecnología debería estar basada en el servidor, estoy más interesado en la base de datos y luego elegiría el lenguaje apropiado para escribirlo.

Más especificaciones: el tamaño de la base de datos debe ser ilimitado.

¿Fue útil?

Solución

Deberías considerar el uso de Lucene. Te permite almacenar grandes cantidades de texto y consultarlos muy rápido. Con buena coincidencia de relevancia también.

Otros consejos

No mencionas la tecnología que usarás; Tamaño de las entradas de texto o naturaleza de las comparaciones. Sin embargo, he encontrado que base de datos h2 es excelente. Es Java nativo y se puede utilizar como una base de datos en memoria que hace que la configuración sea trivial.

PostgreSql es un motor de base de datos gratuito que es muy escalable y ampliamente utilizado, además de MySQL.

Sql Server Express

Recomendaría MySQL. Tiene muchas funciones integradas de manejo de cadenas.

porque no especifica, por qué no SQL Server 2008 Express Edition ?

Todas las funciones de búsqueda con el hermano mayor SQL Server 2008 con el único problema que no puede superar los 4 GB de la base de datos.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top