Domanda

Ho letto su un articolo intitolato "hands-on" Cassandra che Tokyo Gabinetto non è un bene per i grandi dati . Perché? Quanti byte TC ha bisogno di memorizzare prima di iniziare a lavorare male? È è possibile determinare un valore approssimato?

È stato utile?

Soluzione

In base a questo articolo , c'è un degrado di prestazioni confermato passato da 500 GB.

In base a questa vasta confronto dei database NoSQL, i problemi in TC inizio alle righe> 20mm.

Tra le possibili cause di dimensioni dipendenza è il fatto che sembra TC è implementato utilizzando gli hash, e ad un certo punto si esegue in collisioni chiave hash che naturalmente rovine delle prestazioni. Per impostazione predefinita, lo spazio chiave non è così grande come può essere (è necessario sintonizzare "bnum" parametro - numero di elementi dell'array secchio - per aumentare le prestazioni)

Sulla base di vari confronti, MongoDB sembra essere l'approccio raccomandato per grandi insiemi di dati.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top