문제

당신을 감사 Java 응용 프로그램를 위한 최악의 모범 사례에 올 때 높은 가용성 및 재난 복구,당신은 아마도 모를 위한 하드 코딩된 IP 주소 및 차 캐시 바인딩을 처리합니다.다른 무엇을 생각해야 하는가?

도움이 되었습니까?

해결책

의 부족 활동/주니다.

Java 응용 프로그램을 재개 할 수 있어야한되었을 때 추락했다.
즉 메커니즘이 있어야 합 기록할 수 있는 것은 이미 완료(지하기 위해 할 모든 것을 다시 실행).

는 또한 의미한 Java 프로그램은 항상 달 후 상태 설정의 작업이 있습니다.(뭔가를 하는 두 번 결과 같은 결과,그리고 작업을 이미 수행 할 수 없이 다시 있지만,단순히 건너뛰)

는 기록을 취할 수 있는 많은 양식을(파일,데이터베이스,메타데이터에서 저장소의 종류,...),그러나 지점은:Java 응용 프로그램을 복구하고자하는 가능한 한 빨리 알고 있어야 합 그것은 이미 이루어집니다.

다른 팁

모니터링 시설 부족. 조만간 모든 응용 프로그램이 실패합니다. 그런 일이 발생하면 다른 사람이하기 전에 알고 싶을 것입니다.

벌목 부족. 앱을 죽인 것을 찾을 수 없다면 앱을 해결하기가 어렵습니다. 프로 프로 사례가있는 간헐적 인 실패가있을 때 특히 불쾌합니다.

적절한 모니터링이 이미 언급되었으므로 비상 계획을 추가 할 것입니다. 그것은 단순한 일이 될 수 있습니다. 이런 일이 발생하면 우리는이 작업을 수행합니다. 다른 일이 발생하면 우리는 그렇게합니다. 그런 다음 문제가 발생하면 모든 사람이 당황하고 빠른 결정을 내리는 대신 (이전에 테스트 된) 계획을 따릅니다.

내가 알 수 있듯이 당신이 요구하는 것에 대한 몇 가지 주요 측면이 있습니다. 나는 그것이 언어에 따라 다르다고 생각하지 않으며, 당신은 Java 앱을 예로 사용 했으므로 Java에 대해 구체적으로 이야기하지 않기를 바랍니다.

장애 조치/ha: 여기에서 SPOF - 단일 고장 지점을 식별합니다. 예를 들어 언급 한 바와 같이 하드 코딩 된 주소뿐만 아니라 로컬 디스크와 같은 복제 할 수없는 수단에 데이터를 저장하는 응용 프로그램도 포함됩니다. 다른 항목은 "너무 긴"DNS 조회를 캐싱하는 것일 수 있으며, 중단 된 연결을 다시 설정하지 않고 특정 하드웨어 정보 (예 : MAC 주소, CPUID, 동금, 파티션 레이블, MB 또는 드라이브 일련 번호 등)를 찾는 것일 수 있습니다. BCP/DR 기능을 얻기 위해 불필요한 해결 방법으로 이어지는 문제로 이들 모두를 보았습니다.

데이터 무결성: 데이터는 어떻게 저장됩니까? 사용자 정의 형식/구조를 사용합니까? 그렇다면 "덤프 및 복원"메커니즘이 있습니까? 서비스는 고객 서비스를 중단해야합니까, 아니면 백업을 수행하기 위해 서비스를 저하 시키는가? 장치에 비동기 적으로 데이터를 작성합니까? 그렇다면 얼마나 자주 디스크에 "플러시"되는가 (때로는 앱에 달려 있고 다른 사람들은 그리 많지 않습니다)? 파일 잠금, 메모리 대기업 스토리지 기간 및 기능도 이에 따라 일부입니다.

본질적으로 작업 해야하는 원인을 살펴보십시오. 그런 다음 그것이 어떻게 무너 졌는지 살펴보면 아마도 BCP/DR을 개선하는 데 사용하는 패턴과 문제를 일으키는 반포 스크린이라는 두 가지 중요한 지식을 개발하기 시작할 것입니다. 이러한 유형의 질문을 개발 프로세스에 주입하면 개발자가 초기에 개발자가 찾고있는 패턴과 방지 방지를 도출하는 데 도움이됩니다. 종종 질문을하는 것이 문제를 방지합니다.

가장 좋은 방법은 다운 타임을 예약하고 테스트하는 것입니다. 이 작업을 수행하는 데 더 많은 문제가 있습니다. 모든 것을 문서화 한 후에는 다른 사람에게 도움없이 다른 사람을 데려 오십시오. ;)

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top