SharedIT | 묻고 답하기(AMP)

시스템 복구 절차와 모의테스트

안녕하세요 중소기업에서 1인 전산담당자로 일하고 있습니다.

처음 제가 입사 했을 때 전산실와 담당자가 원래 없었고, 전산관련된 것이 아무것도 없다보니

열의를 가지고 하나둘씩 정립해가고 있는데

이번엔 시스템 복구 관련해서 복구 절차라던가 모의테스트에 관해서 해볼까 합니다.

그런데 막상 할려니 좀 캄캄한데 다들 시스템 복구 관련해서 분류나 절차 등을 어떻게 수립하시거나

운영하고 계시는지 궁금합니다.


너무 광범위 할꺼 같아서 일단은 아래처럼 4가지로 분류할까합니다.

  • 1.서비스 별

  • 2.네트워크

  • 3.재해 별

  • 4.해킹이나 랜섬웨어 등

7개의 답변이 있습니다.

쿨가이
  0 추천 | 4년 이하 전

우선순위(서버나 데이터)를 정해서 복구시점 (RTO)을 정해야 하구요.

더 세련되게는 업무 프로세스별로 복구목표를 설정해야 합니다.

백업이나 이중화 설계가 그 다음에 되야 하구요.

복구 테스트하는것도 의미가 있지만 목표가 명확하지 않은 상황에서는 의미가 반감되지요

support
  0 추천 | 4년 이하 전 | (주)제론소프트엔 | 070-7764-0100

안녕하세요. 

  • 1.서비스 별
    ==> 각각의 증상별로 분류할 수 있을 것 같습니다. 혼자서 IT운용하시는 담당자라면 온갖 다양한 OS설치,IP설정,네트워크프린터,보안설정등의 다양한 서비스를 말씀하시는 걸로 이해하는데 그러한 서비스를 감안한 클라이언트 PC의 모든 설정을 반영된 형태로 시스템 복원이 되어야 하며, 사용자 데이터는 별도 파티션 및 디스크에 실시간백업토록 구성되어야 할 것으로 보여집니다. 
    필요시에 서버로 백업하는 것은 백업스토리지를 통하 구성이 필요해보여집니다.  

  • 2.네트워크
    ==> 시스템복구에 가장 기본 네트워크는 IP설정 및 네트워크 구성을 자동 프로파일값형태로 백업해서 시스템복원시점에 동일한 형태로 반영할 수 있도록 구성되어야 할 것으로 보여집니다. 서버상에서 개별 PC를 마스터이미지를 통한 구성은 일+일이 발생하는 조건이므로 비추입니다. 

  • 3.재해 별
    ==> 재해중에 재해는 시스템 부팅불,  전원불등의 시스템결함과 물리적인 파손으로 구분할 수 있는데, 단순히 소프트웨어적인 시스템부팅불일 경우 백업된 데이터를 기반으로 10분내에 시스템복원으로 처리하는 것이 가장 좋을 것입니다. 물리적인 파손은 OMG~~ㅠㅜ...어쩔수 없죠!!

  • 4.해킹이나 랜섬웨어 등
    ==> 해킹을 감안하면 백업스토리지 or 별도 클라우드 서비스를 통한 지속적인 중요데이터관리가 필요합니다. 
    반면, 랜섬웨어는 위에서 많은 분들이 조언했듯이 그 또한 지속적인 백업이 중요합니다. 하지만, 랜섬웨어를 네트워크레벨, 클라이언트레벨에서 차단할 수 있는 프로그램 인프라를 구축이 필요합니다. 

상기 기능을 통합한 온라인원격통합관리할 수 있는 방식의 솔루션을 도입구축하는 것을 제안드립니다. 
감사합니다. 

밤에피는장비
  0 추천 | 4년 이하 전

가장 기본적으로 RTO와 RPO를 선정하세요.

우리 회사의 RTO와 RPO에 따라 백업시스템의 구축규모를 사이징하세요.

백업이 중요한것인지 다운타임 최소화가 중요한 것인지 판단하시고, 모의점검 진행을 해보세요.

무중단 시스템의 모의점검을 위한다면 HA 등 이중화테스트에 포커스를 두시고,

재해에 대한 모의점검은 별도의 공간의 백업 Tape 을 복구하여 시스템을 원복한다는 개념으로 모의점검하시면 될 듯합니다. 복구시점의 손실 최소화를 위해서 어떠한 보완점이 있어야 할지도 도출할 수 있을거에요.


yeom1563 | 4년 이하 전

감사합니다

공통적으로 우선순위를 두어서 높은 순 대로 모의테스트와 복구 시나리오를 정하면 되겠군요 

wansoo
  0 추천 | 4년 이하 전

복구를 위해서는 백업이 잘 되어 있는지 부터 확인을 하는 절차가 필요할 것 같네요.

백업이 잘되어 있는지, 복구할 수 있는 성공적으로 백업된 최신 자료 백업 시점이 언제인지...

더 좋은 복구 방법은 없는 지 검토해보는 절차가 필요할 것 같고요.

상황에 따라서... 업무의 긴급성에 따라서, 자료 복구를 뒤로 미루고 시스템 복구부터 해서 업무를 계속할 수 있도록 시스템 및 서비스 부터 복구한 후에 데이터 복구를 진행할 수도 있겠고요.


상황에 따라서는 복구 전에 문제가 생긴 원인 부터 파악해야 할 경우도 있을 것 같고요.

급하게 시스템을 복구하다가 중요한 단서들이 훼손되어 원인 파악을 하지 못할 수도 있기 때문에 원인 파악이 중요한지 업무 복구가 더 중요한지, 데이터 복구가 더 중요한지 등을 잘 파악해서 진행할 필요가 있을 것 같고요.


일반적으로  1. 서비스, 2. 네트워크에 대한 장애가 발생했을 경우에는 데이터 손실이 발생하지 않을 가능성이 높을 것 같고요. 이럴 경우에는 서비스 및 네트워크를 가능한 빨리 복구할 수 있는 방법을 검토해서 진행해나가야 하겠고요.

3. 재해가 발생했을 경우에는 데이터 손상이 동반될 가능성이 높아서 자료 손상 여부, 데이터 복구 방안에 대한 검토를 신중히 진행해야 할 경우가 많을 것 같고요.


4. 해킹이나 랜섬웨어는 자료 복구 못지 않게 원인 파악 및 피해 규모 등을 제대로 파악하는게 중요하기 때문에 증거될 내용들을 잘 보존하면서 시스템을 복구할  수 있는 방안을 고민해야 할거라 생각되네요.

yeom1563 | 4년 이하 전

감사합니다 어제는 바빠서 글 써놓고 보지를 못했는데

많은 도움이 되었습니다.

차바라기
  0 추천 | 4년 이하 전

1)서버는 백업후 복구 테스트 하시고 정전 대비 서버 다운/업 시간 체크

2)네트워크는 이중화가 되어있다면 크로스체크가 되는지

3)재해별로는 회사에 정전이 되었을때 대비

4)해킹하고 랜섬웨어는 이건 솔루션이 있어야 할듯합니다.

yeom1563 | 4년 이하 전

자세하게 써주셔서 감사합니다.

일단 복구 테스트와 서버 다운/업 체크 부터 해야 겠군요

backattack
  0 추천 | 4년 이하 전

1.회사 업무 연속성을 위해 중요도 높은 시스템(or data) 우선 순위 구분 

2.우선 순위별 복구 계획 (시나리오) 점검

3.각 각의 복구 훈련 실시 및 복구까지의 시간 , 복구율 확인 

4. 복구 완료 후 손실된 data 점검 


 


yeom1563 | 4년 이하 전

업무 연속성을 위한 복구 우선순위 정하고 높은 순부터 정리를 하도록 하겠습니다.

그런데 시나리오 같은 경우에는 어떤것들이 있나요?

혹시 좀더 설명해주실수 있나요?

Genghis Khan
  0 추천 | 4년 이하 전

모든 사스템 복구 절차는 alt 서버가 있어야 해요

1) 서버별은 백업 솔루션 복구인지 (os,disk copy) 복구인지  

2)네트워크는 이중화 test로 하는게 적절하구요 ex) 방화벽, ips ,switch

3) 재해별은? 모르겠내요

4)해킹이나 랜섬웨어는 관제  서비스를 받고 계시면 업체에 요청하시면 되나 그렇지 못한다면

apt 솔루션과 해킹은 별도 프로그램으로ㅠ해보셔 하는데 보안 관제 서비스 서업체를 통해

하시는게 좋겠네요

yeom1563 | 4년 이하 전

감사합니다.

그런데 alt서버라는게 어떤건가요?

아직 배울게 많은거 같습니다.. ㅠ