문제

다가오는 프로젝트를위한 스토리지 플랫폼을 평가하고 있으며 Cassandra로 계속 돌아옵니다. 이 프로젝트를 잃어버린 경우 어느 데이터의 양은 용납 할 수 없습니다. 지금까지 우리는 관계형 데이터베이스 (Microsoft SQL Server)를 사용했지만 데이터는 매우 다양하고 크기 때문에 저장 및 쿼리에 문제가되었습니다.

Cassandra는 기본 데이터 저장소로 사용하기에 강력합니까? 아니면 기존 데이터를 미러링하여 액세스 속도를 높이는 데 사용해야합니까?

도움이 되었습니까?

해결책

일화 적으로 : 예, 트위터, Digg, Ooyala, Simplegeo, Mahalo 등 기본 데이터 저장소를 위해 Cassandra로 사용하거나 이동합니다 (http://n2.nabble.com/cassandra-users-survey-td4040068.html).

기술적으로 : 예; 복제를 지원하는 것 외에도 (여러 데이터 센터 포함) 각 Cassandra 노드에는 FSYNC 커밋 로그가있어 쓰기가 내구성이 있는지 확인합니다. 거기에서 쓰기는 압축 (여러 sstables)과 GC 이전 버전을 결합 할 때까지 불변의 sstables로 바뀝니다. 스냅 샷은 자동 스냅 샷 전략을 포함하여 언제든지 지원됩니다.

다른 팁

응용 프로그램에 Cassandra를 사용할지 여부는 순전히 데이터 워크로드에 따라 다릅니다. Cassandra는 쓰기 집약적 인 워크로드에 최적화되므로 많은 양의 데이터를 삽입 해야하는 응용 프로그램 (예 : Facebook의 인프라 로깅 정보)에 적합합니다.

그러나 빠른 검색 및 삽입 속도가 필요한 경우 문제가되지 않으면 HBase (읽기 집약적 인 워크로드로 최적화 된)를 살펴 봐야 할 것입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top