다른 유형의 데이터를 색인화하기 위해 Solr 사용
문제
나는 사용을 고려하고있다 아파치 솔러 새 프로젝트에서 데이터를 색인화합니다. 데이터는 다른 독립 유형으로 만들어졌습니다. 예를 들어
- 식물
- 동물
- 자동차
- 컴퓨터
색인. 각 유형에 대해 다른 인덱스를 사용해야합니까, 아니면 하나의 인덱스 만 사용하는 것이 더 합리적입니까? 많은 인덱스를 사용하는 것이 성능에 어떤 영향을 미칩니 까? 아니면 이것을 달성 할 수있는 다른 가능성이 있습니까?
감사.
해결책
둘 다 합법적 인 접근 방식이지만 트레이드 오프가 있습니다. 첫째, 데이터 세트는 얼마나 큰가요? 여러 서버에서 파티션 할 수있을만큼 충분히 크면 다른 인덱스를 갖는 것이 합리적 일 것입니다.
둘째, 성능이 얼마나 중요한지 - 모든 것을 함께 인덱싱하면 성능이 악화 될 수 있지만 학위는 데이터의 양과 쿼리가 얼마나 복잡 할 수 있는지에 달려 있습니다.
셋째, 동일한 검색에서 여러 데이터 유형을 쿼리해야합니까? 그렇다면 모든 것을 함께 인덱싱하는 것은 편리한 방법이 될 수 있습니다. 기술적으로 이것은 별도의 색인으로 달성 될 수 있지만 쿼리에 가장 관련성이 높은 결과를 얻는 것은 도전이 될 수 있습니다 (아직 아님).
넷째, 단일 스키마 및 구성이있는 단일 인덱스는 시스템을 배포하고 유지 관리 할 사람의 수명을 단순화 할 수 있습니다.
고려해야 할 또 다른 점은 ID입니다. 다른 모든 객체에 모든 유형의 고유 식별자가 있습니까? 그렇지 않다면, 당신이 그것들을 함께 인덱싱하려면 이것을 생성해야 할 것입니다.
제휴하지 않습니다 StackOverflow