정보보안기사

[정보보안기사] SECTION 41 BCP/DRP

tnvori 2026. 3. 6. 18:51

설악산. 안개가 상당했다

 

  1.  BCP/DRP
    1. 개요
      1. 비즈니스 연속성 계획(BCP)
        • 개요
          • IT 부문뿐만 아니라 인력, 설비, 자금 등 조직의 모든 자원을 대상으로 장애 및 재해로부터 조직의 생존을 보장하기 위한 예방 및 복구 활동 등을 포함하는 광범위한 계획
          • 장애 및 재해로 중단된 조직의 핵심 업무를 언제까지, 누가, 어떤 자원을 활용하여, 어떻게 복구할 것인지 구체적으로 기술한 일종의 절차서
          • 업무 영향 분석(BIA)
            • 어떤 업무가 우선 복구돼야 하는지 파악하는 과정
            • BCP의 핵심 절차로 전체 사업에 존재하는 핵심 업무를 파악하고 업무별로 전체 사업에 미치는 영향도를 분석하여 장애 및 재해 시스 복구 우선순위를 결정하는 과정
            • 주요 내용
              • 주요 업무 프로세스 식별
              • 재해 유형 식별 및 재해 발생 가능성과 발생 시 업무 중단의 지속 시간 평가
              • 업무 프로세스별 중요도 및 재해로 인한 업무 중단 시의 손실 평가
              • 업무 프로세스별 우선순위 및 복구 대상 범위 설정
              • 재해 발생 시 업무 프로세스의 복원 시간 및 우선순위 결정
        • BCP 5단계 방법론
          • 프로젝트 범위 설정 및 기획 — 프로젝트 계획을 수립하는 단계로 BCP 개발의 명확한 범위, 조직, 시간, 인원 등 정의
          • BIA
            • 개별 업무를 식별하고 복구 우선순위, 복구 목표 시간 및 수준 등 평가
            • 개별 업무 중단 시 재정적 손실 정도 평가
          • 복구 전략 개발 — BIA 단계에서 수집한 정보를 바탕으로 복구 자원 및 복구 방안에 대한 평가 및 예상 비용 산정
          • 복구 계획 수립 — 실제 복구 계획을 수립하는 단계로 명시적인 문서화가 요구됨
          • 프로젝트 수행 테스트 및 유지보수 향후 수행할 테스트 및 유지보수 관리 절차 수립
      2. 재난 복구 계획(DRP)
        • 개요
          • 장기간에 걸친 재해나 재난으로 피해 입은 시설의 접근 거부 등의 이벤트를 다룸
          • 비상사태 발생 후 대체 사이트에서의 목표 시스템, 응용프로그램, 컴퓨터 설비의 운영 체제 등의 IT 중심의 계획
        • BCP와 DRP
          • BCP — 심각한 실패나 재해로 인해 사업 활동과 프로세스가 중단되는 것에 대응하기 위해 명확하고 상세히 기술된 계획을 개발하는 것에 초점
          • DRP — 심각한 실패나 재해의 영향으로 핵심 정보 시스템과 데이터가 중단되는 것에 대응하기 위해 명확하고 상세히 기술된 계획을 개발하는 것에 초점
          • BCM(Business Continuity Management)
            • 전체론적 관리 프로세스
            • 기획 단계 — 기관의 정책 및 목표와 연계된 업무 연속성 정책, 목표, 프로세스 및 절차를 수립하는 단계
            • 운영 단계 — 업무 연속성 프로세스를 실행하고 구현에 필요한 통제 및 절차를 수립, 운영하는 단계
            • 검토 및 개선 단계
    2. 복구 전략
      1. 개요 — BIA 단계에서 식별된 위협에 대응하기 위해 구현되어야 하는 가장 효율적이고, 비용 효과적인 복구 메커니즘 개발
      2. 2차 사이트 종류별 특징
        • 미러 사이트 — 둘 다 실시간
        • 핫 사이트 — 주 선테어와 동일한 수준의 시스템을 재해 복구 센터에 대기 상태로 두어 동기적/비동기적 방식의 실시간 복제를 통하여 최신 데이터 상태를 유지하고 있다가 재해 복구 센터의 시스템을 액티브로 전환하여 복구하는 방식
        • 웜 사이트 — 중요성이 높은 자원만 부분적으로
        • 콜드 사이트 — 최소
        • 제3의 사이트
          • BIA 단계에서 필요할 때 이용할 수 없는 백업 시설물의 위험성을 인식하고 제3의 백업 사이트 구축
          • 주 백업 사이트가 가용되지 않을 경우를 대비한 부차적인 백업 사이트
        • 상호 지원 계약
      3. 하드웨어 및 소프트웨어 백업
        • 하드웨어 백업 관리 기준
          • 하드웨어 서비스 업체와의 SLA를 검토하고 온 사이트 전략과 오프 사이트 전략이 마련돼야 함
          • SLA — 이용자와 제공자 사이에서 교환되는 특정 기간의 서비스 레벨에 관한 계약
          • 가용성 계산
            • MTBF(Mean Time Between Failures)
              • vudrbs rhwkd rksrur tlrks
              • MTTF + MTTR
            • MTTF(Mean Time to Failure)
              • 평균 운영 시간
              • 총 운영 시간 / 총 고장 건수
            • MTTR(Mean Time to Repair)
              • 평균 수리 시간
              • 총 수리 시간 / 총 고장 건수
            • 가용성
              • MTTF / MTBF
              • MTTF / (MTTF + MTTR)
        • 소프트웨어 백업
          • 기업의 운영 시스템 소프트웨어와 중요 애플리케이션에 대한 복사본은 최소 2개 소유 및 보증이 필요함 — 온 사이트와 오프 사이트
      4. RAID(Redundancy array of inexpensive disks)
        • 개요
          • 데이터 중복 지원 시스템의 대표적인 방법
          • 이중화 및 성능 향상을 위한 기술
          • 몇 개의 물리적인 디스클 묶고 이들을 논리적인 어레이로 정의하지만, 실제 데이터는 여러 개의 물리적인 디스크에 저장됨
        • 목적
          • 저용량, 저성능, 저가용성인 디스크를 어레이 구조로 중복하여 구성함으로써 고성능 디스크 대체
          • 중복 저장 및 오류 검증을 통해 결함 허용도 향상
        • 종류 및 설명
          • Level 0(Stripped Disk Array without Fault Tolerance)
            • 스트라이핑
            • 하나의 데이터를 여러 드라이브에 분산 저장함으로써 빠른 입출력 가능
          • Level 1(Disk Mirror)
            • 미러링
            • 동일한 데이터가 두 개 이상의 디스크에 동시에 저장되고, 하나의 디스크에 오류가 발생하더라도 다른 드라이브의 동일한 데이터 사용 가능
          • Level 2(Hamming Code ECC) — 데이터 스트라이핑이 모든 드라이브에서 일어나고, 패리티 데이터는 오류 식별을 위한 해밍 코드와 함께 생성됨
          • Level 3(Parallel Transfer with parity)
            • Level 0, 1의 문제점 보완
            • 바이트 단위로 데이터 분산 저장
            • 스트라이핑이 모든 드라이브에서 일어나고, 에러 체크 및 수정을 위해 패리티 정보를 별도의 디스크에 따로 저장하는 구조
          • Level 4(Block Level Parity)
            • Level 3과 동일한 구조
            • 즐록 단위로 데이터 분산 저장
            • 한 번의 작업으로 데이터를 읽을 수 있어 성능 향상
          • Level 5(Independent Access with Parity)
            • 데이터와 패리티가 모든 드라이브의 디스크 섹터 단위에 저장됨
            • Level 3, 4의 문제점을 보완하는 방식으로 패리티를 저장하는 디스크가 별도로 필요하지 않고 모든 디스크에 패리티 정보를 분산하여 저장
          • Level 0 + 1, 1 + 0
            • 0 + 1 — 0과 1을 조합한 것 → ?
            • 1 + 0
              • 디스크를 미러링한 후, 그 쌍을 스트라이프하는 것
              • 0 + 1에서 하나의 디스크가 고장났을 때 스트라이프는 전부 접근이 불가능하게 되는 단점 보완
      5. 데이터 백업
        • 유형
          • 완전 백업
            • 모든 데이터가 백업되어 어 떤 형태의 저장 매체에 저장하는 것으로, 완전 백업 동안 아카이브 비트는 해제됨
            • 복구 과정은 한 단계지만 장시간 소요되고, 많은 양의 백업 매체 필요
          • 차등 백업
            • 완전 백업을 차등 백업과 같이 사용하는 방법
            • 가장 최근의 완전 백업 이후에 수정된 파일만 백업하는 방식
            • 먼저 완전 백업이 수행되고, 이후 차등 백업 수행
            • 아카이브 비트 값을 변경하지 않음
          • 증분 백업
            • 완전 백업을 증분 백업과 같이 사용하는 방법
            • 마지막 완전 백업이나 증분 백업 이후에 변경된 파일을 백업하고 아카이브 비트를 0으로 설정
            • 완전 백업이 수행되고, 그 다음 각각의 증분 백업이 수행되고 그 다음 각각의 증분 백업이 순차적으로 수행
            • 복구 시 많은 매체 필요 백업 시간이 절감되며 저장 매체를 효율적으로 이용 가능
        • 데이터 백업 방법 선택 시 고려 사항
          • 차등 백업 — 복잡하지만 적은 리소스와 시간
          • 증분 백업 — 올바른 순서로 각각의 증분 백업을 모두 복구해야 하지만 차등 백업이 복구를 수행하는 것은 2단계로 이루어짐
    3. 복구와 회복
      1. BCP/DRP 단계
        • 재해 대응 및 복구 관련 용어
          • 복구 목표 시간(RTO) — 비즈니스가 복구되어야 하는 최단 시간 및 서비스 수준
          • 작업 복구 시간(WRT) — 데이터 복구와 프로세스 시험 등의 목적을 위해 실행되는 모든 것
          • (최대 허용 중단 시간(MTD)
            • RTO + WRT
            • 치명적 손실 없이 조직이 운영을 중단하고 견딜 수 있는 최대 시간
          • 복구 목표 지점(RPO) — 시간으로 측정되는 수용 가능한 데이터 손실의 양. 데이터가 복구되어야 하는 가장 빠른 시점
          • 복구 기간(RT) — 실제 업무 기능 복구까지 걸린 시간
      2. BCP/DRP 테스트
        • 종류
          • 체크리스트
          • 구조적 워크스루 — 각 기능 대표자들의 BCP 검토 회의
          • 시뮬레이션 — 2차 사이트로 재배치까지만
          • 병행 테스트
          • 완전 중단 테스트
        • 테스트 시 고려 사항
          • 반드시 사전에 공지해야 함
          • 핵심 인력을 포함한 전 직원 참여 필요
          • 업무 폭주 시간대 회피