Выбор улья / IMPALA и средние все версии Roweyey
Вопрос
Мне интересно, есть ли способ получить предыдущие версии определенного нажима в HBASE без необходимости писать программу MapReduce и среднего значения.Мне было любопытно, возможно ли это возможно использовать улей или IMPALA (или другую подобную программу) и как вы это сделаете.
Мой стол выглядит так:
Composite keys Values
(md5 + date + id) | (value)
.
Я хотел бы в среднем все значения для конкретной даты и поддона идентификатора («411») для всех версий.
заранее спасибо.
Решение
Impala использует метастор улья для отображения его логического понятия таблицы на данные, физически хранится в HDFS или HBASE (для получения более подробной информации см., см. «H httry=» http://www.cloudera.com/content/cloudera- Content / Cloudera-Docs / Impala / Neighle / Установка и с использованием-IMPALA / CIIU_CONCECKS.HTML? SCROLL= INTRO_HIVE_UNIQUE_2 "REL=" NOFOLLOW "> Документация Cloudera ).
Чтобы узнать больше о том, как сказать The Tive MetaStore о данных, хранящихся в HBASE, см. В HBASE, см. Документация улья .
К сожалению, как отмечено в документации в улье, связанные выше:
В настоящее время нет способа получить доступ к атрибуту Timestamm HBASE и Запросы всегда доступа к данным с последними временными метками
Проводится некоторая работа, чтобы добавить эту функцию против более старой версии Hive в 2828 , хотя, к сожалению, эта работа еще не объединена в багажник.
Так что для вашего приложения вам придется переделать свою схему HBase, чтобы включить столбец «версию», сообщите The Tive MetaStore об этом новом столбце и сделайте ваше приложение в этом столбце.