Domanda

Voglio usare HBase come un negozio dove posso spingere a qualche milione di voci del formato {document => {term => weight}} esempio "Inserisci termine X nel documento Y con il peso Z" e quindi emettere un comando come "selezionare la parte superiore 1000 termini di questo documento" o "Seleziona il termine superiore 1000 per ogni documento". Questo funziona in mia implementazione MySQL attuale, ma forse il dominio è più adatto a HBase. Prendo atto che HBase e BigTable sono utilizzati per l'indicizzazione full-text, che è un dominio del problema simile.

Si può dire che io non ho fatto altro che leggere alcune pagine su HBase, ma spero che si capisce il senso della mia domanda. E 'legato alla questa domanda .

Possibili ostacoli potrebbero includere HBase non consentendo query con l'equivalente di una clausola LIMIT. Dato che voglio interrogare in peso, vorrei associare {weight => term}, che sarebbe problematico per due mandati con lo stesso peso (suppongo che HBase permette solo chiavi univoche). In alternativa avrei dovuto memorizzare una raccolta di termini per un dato peso, ma questo sarebbe limitare la mia capacità di limitare con precisione il numero di termini restituiti.

È stato utile?

Soluzione

Risposta semplice sì.

risposta più complessa, in questo momento oggi questi "no sql" archivio dati di ciascun implementare la propria interfaccia programmatori e come il "no sql" implica che non sono SQL in base. Quindi preparatevi per un po 'di codifica, nulla della sua difficile però. Per lo più questi archivi di dati sono solo coppie memorie dei valori di nome, ha ottenuto in via REST o SOAP (HBase ha anche un concetto di Famiglie colonna). Quello che si prestano verso se è Mappa Ridurre, un interessante campo di query e vale la pena leggere su.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top