이것이 HBase의 적절한 (또는 가능한) 사용입니까?
문제
HBase를 매장으로 사용하고 싶습니다. {document => {term => weight}}
예를 들어 "무게 z가있는 문서 y에 X를 삽입 한 다음"이 문서의 상위 1000 용어를 선택하십시오 "또는"각 문서의 상위 1000 항을 선택하십시오 "와 같은 명령을 발행하십시오. 이것은 내 현재 MySQL 구현에서 작동하지만 도메인은 HBase에 더 적합합니다. HBase와 BigTable은 유사한 문제 영역 인 Full-Text Indexing에 사용됩니다.
당신은 내가 HBASE에서 몇 페이지를 읽는 것 이상을하지 않았다고 말할 수 있지만, 내 질문의 요점을 이해하기를 바랍니다. 관련이 있습니다 이 질문.
가능한 장벽은 HBase가 동등한 쿼리를 허용하지 않는 것을 포함 할 수 있습니다. LIMIT
절. 체중으로 쿼리하고 싶다는 점을 감안할 때 연관하고 싶습니다. {weight => term}
, 이는 동일한 무게를 가진 두 용어에 문제가 있습니다 (HBase가 고유 키만 허용한다고 가정합니다). 또는 주어진 가중치에 대한 용어 모음을 저장해야하지만 이는 반환 된 용어 수를 정확하게 제한하는 능력을 제한합니다.
해결책
간단한 대답 예.
더 복잡한 답변, 현재 오늘날이 "SQL 없음"데이터 스토어는 각각 고유 한 프로그래머 인터페이스를 구현하며 "NO SQL"은 SQL 기반이 아님을 암시합니다. 따라서 일부 코딩을 준비하십시오. 대부분이 데이터 스토어는 단지 이름 가치 쌍의 매장 일뿐입니다. REST 또는 SOAP에 도달했습니다 (HBase는 또한 열 패밀리의 개념이 있습니다). 비록 그들이 자신을 빌려주는 것은지도 감소, 매우 흥미로운 쿼리 분야이며 읽을 가치가 있습니다.