Вопрос

Мне интересно, есть ли способ получить предыдущие версии определенного нажима в HBASE без необходимости писать программу MapReduce и среднего значения.Мне было любопытно, возможно ли это возможно использовать улей или IMPALA (или другую подобную программу) и как вы это сделаете.

Мой стол выглядит так:

  Composite keys          Values 
  (md5 + date + id) | (value)
.

Я хотел бы в среднем все значения для конкретной даты и поддона идентификатора («411») для всех версий.

заранее спасибо.

Это было полезно?

Решение

Impala использует метастор улья для отображения его логического понятия таблицы на данные, физически хранится в HDFS или HBASE (для получения более подробной информации см., см. «H httry=» http://www.cloudera.com/content/cloudera- Content / Cloudera-Docs / Impala / Neighle / Установка и с использованием-IMPALA / CIIU_CONCECKS.HTML? SCROLL= INTRO_HIVE_UNIQUE_2 "REL=" NOFOLLOW "> Документация Cloudera ).

Чтобы узнать больше о том, как сказать The Tive MetaStore о данных, хранящихся в HBASE, см. В HBASE, см. Документация улья .

К сожалению, как отмечено в документации в улье, связанные выше:

В настоящее время нет способа получить доступ к атрибуту Timestamm HBASE и Запросы всегда доступа к данным с последними временными метками

Проводится некоторая работа, чтобы добавить эту функцию против более старой версии Hive в 2828 , хотя, к сожалению, эта работа еще не объединена в багажник.

Так что для вашего приложения вам придется переделать свою схему HBase, чтобы включить столбец «версию», сообщите The Tive MetaStore об этом новом столбце и сделайте ваше приложение в этом столбце.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top