Pregunta

Soy relativamente nuevo en la base de datos columnar, por favor perdona la ignorancia. Digamos que tengo 1,000,000 de columnas. Me gustaría devolver una muestra aleatoria del 10% de esas columnas (es decir, C0, C10, C20 ... C999,980, C999,990)

En HBase tienen filtros de columna, podría escribir un filtro de columna que devolviera cada décimo resultado. ¿Puedo hacer esto en Pycassa/Cassanda?

Gracias

¿Fue útil?

Solución

Lo único que puede hacer del lado del servidor son las rebanadas. Por lo tanto, puede leer a partir de la columna = Límite C10 = 10 para obtener las columnas 10-19. O puede solicitar columnas específicas, por lo que puede solicitar cada décima columna manualmente si sabía cuántas columnas había.

Otros consejos

Puede hacerlo fácilmente con Pycassa, pero Cassandra no admite el filtrado del lado del servidor.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top