Pregunta

Tengo una base de datos que tiene filas muy similares dentro de la misma mesa. Esas filas son similares porque tienen valores casi iguales de las columnas. Necesito integrar las filas correspondientes en una sola fila.

Por ejemplo, los dos usuarios (U1 y U2) debe integrarse:

 u1 = User(name = "William Henry Gates III",
           age = 55,
           nationality = "american",
           alma_mater = "Harvard Univesity")

 u2 = User(name: "William Henry 'Bill' Gates III",
           age: 55,
           nationality: "America",
           alma_mater: "Harvard U.")

Estoy pensando en el uso de algunos distancia de edición y derivada técnicas . Otros algoritmos y técnicas sugerencia? Cualquier biblioteca de votos para usar (preferiblemente en Python o Java)?

¿Fue útil?

Solución

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top