Pregunta

¿Es posible usar Hive para consultar el índice Lucene que se distribuye sobre Hadoop?

¿Fue útil?

Solución

Hasta donde sé, esencialmente puede escribir el código personalizado de "extracción de fila" en Hive, así que supongo que podría. Nunca he usado Lucene y apenas usé Hive, así que no puedo estar seguro. Si encuentra una respuesta más concluyente a su pregunta, ¡publíquela!

Otros consejos

Hader es una startup cuyo software puesta Hadoop con un front-end SQL (como la colmena) y los motores de almacenamiento híbrido. Ofrecen un búsqueda de texto de archivo capacidad que puede satisfacer sus necesidades.

Descargo de responsabilidad: Trabajo para Hadapt.

Sé que esta es una publicación bastante antigua, pero pensé que podría ofrecer una mejor alternativa.

En su caso, en lugar de pasar por la molestia de mapear su índice HDFS Lucene para el esquema Hive, es mejor empujarlos al cerdo, porque el cerdo puede leer archivos planos. A menos que desee una forma relacional de almacenar sus datos, probablemente pueda procesarlos a través del cerdo y usar, HBase como su DB.

Puede escribir un formato de entrada personalizado para Hive para acceder al índice Lucene en Hadoop.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top