문제

나는 사용을 고려하고있다 아파치 솔러 새 프로젝트에서 데이터를 색인화합니다. 데이터는 다른 독립 유형으로 만들어졌습니다. 예를 들어

  • 식물
  • 동물
  • 자동차
  • 컴퓨터

색인. 각 유형에 대해 다른 인덱스를 사용해야합니까, 아니면 하나의 인덱스 만 사용하는 것이 더 합리적입니까? 많은 인덱스를 사용하는 것이 성능에 어떤 영향을 미칩니 까? 아니면 이것을 달성 할 수있는 다른 가능성이 있습니까?

감사.

도움이 되었습니까?

해결책

둘 다 합법적 인 접근 방식이지만 트레이드 오프가 있습니다. 첫째, 데이터 세트는 얼마나 큰가요? 여러 서버에서 파티션 할 수있을만큼 충분히 크면 다른 인덱스를 갖는 것이 합리적 일 것입니다.

둘째, 성능이 얼마나 중요한지 - 모든 것을 함께 인덱싱하면 성능이 악화 될 수 있지만 학위는 데이터의 양과 쿼리가 얼마나 복잡 할 수 있는지에 달려 있습니다.

셋째, 동일한 검색에서 여러 데이터 유형을 쿼리해야합니까? 그렇다면 모든 것을 함께 인덱싱하는 것은 편리한 방법이 될 수 있습니다. 기술적으로 이것은 별도의 색인으로 달성 될 수 있지만 쿼리에 가장 관련성이 높은 결과를 얻는 것은 도전이 될 수 있습니다 (아직 아님).

넷째, 단일 스키마 및 구성이있는 단일 인덱스는 시스템을 배포하고 유지 관리 할 사람의 수명을 단순화 할 수 있습니다.

고려해야 할 또 다른 점은 ID입니다. 다른 모든 객체에 모든 유형의 고유 식별자가 있습니까? 그렇지 않다면, 당신이 그것들을 함께 인덱싱하려면 이것을 생성해야 할 것입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top