독보적인 성능과 업계 최고의 안정성 HPE Nimble Storage

독보적인 성능과 업계 최고의 안정성 HPE Nimble Storage

작년 말에 시행한 쉐어드IT 회원 대상 2022년 IT 예산 설문조사에서 스토리지는 2021년에 실제로 예산을 집행한 분야 3위(10.6%), 그리고 2022년에 투자할 분야 6위(7.2%)로 기록되었습니다.(전체 내용이 궁금하신 분들은 여기서 확인해 보세요.) 

부동의 1위인 서버에 비하면 다소 낮은 비중이긴 하지만 기업에서 취급하는 데이터의 유형이 점점 다양해지고 데이터 용량 역시 계속 증가하고 있는 점, 그리고 재택근무와 같은 원격근무 환경 구현을 위해 VDI가 우선순위로 고려되고 있는 점을 생각해보면 IT 인프라에 있어서 스토리지가 갖는 중요성은 매우 높다고 봐도 될 것 같습니다.



<출처 : 쉐어드IT 2022년 IT 예산 설문조사, 스토리지 분야 추가 설문>



그러나 스토리지가 갖는 중요성에 비해 교체 주기는 꽤나 긴 편입니다. 위와 같이 쉐어드IT 회원들은 스토리지 교체 주기에 대한 질문에 5년 이상이 34%, 10년 이상이. 8.5%, 명확한 교체주기 없이 고장 날 때까지 사용이 14.9%를 차지했고 이 셋의 비중은 무려 57.4%로 절반을 넘습니다. 즉, 절반 이상의 회원들은 스토리지 교체 주기를 5년보다 길게 잡고 있으며, 설문에 참여하지 않은 대다수의 IT 담당자들의 현실까지 감안한다면 스토리지 교체 주기는 IT 인프라 중에서도 꽤 긴 편에 속하지 않을까 싶네요.




<이미지 출처 : Personnel Today, Is it really the end of the office?>


하지만 코로나19 이후 비대면 환경이 일상화되면서 기업이 IT를 바라보는 시각은 많이 달라졌습니다. 과거 비용만 축내는 부서라는 이미지가 강했다면, 지금은 기업의 비즈니스 경쟁력을 끌어올리기 위해 데이터를 분석하고 데이터 기반 의사 결정을 돕는, 기업 경쟁력 혁신의 첨병이 되었죠. 그리고 그 중심에는 데이터가 있습니다. 이 데이터를 저장하고 처리하는 장비는 스토리지죠. 따라서, 데이터의 중요성이 커짐과 동시에 앞으로 점점 더 주목받게 될 IT 인프라는 스토리지라고 할 수 있습니다.


그래서 이번 콘텐츠에서는 글로벌 스토리지 분야의 리더 HPE의 Nimble Storage를 소개하려고 합니다. 제 기억의 Nimble Storage는 별도의 독립된 기업이었는데 언제 HPE에 인수됐을까요? 국내에 지사도 있었던 것으로 기억하는데 말이죠. 이에 대한 내용을 포함해서 왜 HPE의 Nimble Storage가 업종 불문 미션 크리티컬한 업무 및 다양한 분야에 널리 활용되고 있는지를 살펴보겠습니다.

주요 아젠다는 아래와 같습니다.


1. HPE, Nimble Storage 개요

2. HPE Nimble Storage의 차별화된 특징

3. 스토리지 관리자의 든든한 지원군, HPE InfoSight

4. HCI 2.0을 위한 HPE Nimble Storage, dHCI

5. 결론





이 콘텐츠는 HPE와 BayNex의 지원으로 제작되었습니다.






1. HPE, Nimble Storage 개요




<이미지 출처 : HPE, 주요 스토리지 부문 2021 Gartner® Magic Quadrant™>


스토리지 분야에서 HPE의 위상은 위의 가트너 매직 쿼드런트 보고서로 요약될 것 같습니다. HPE는 오랫동안 줄곧 리더의 자리를 지켜왔고 국내외 많은 기업들이 상기 보고서 리더 부문에 오른 기업들의 스토리지를 사용하고 있죠. 하지만 글로벌 x86 서버 시장을 이끌어온 HPE는 기업용 데이터 스토리지 분야에서 보다 치열한 경쟁을 벌이고 있습니다. 리더 부문 상위에 오른 기업들만 보더라도 그 수가 꽤 많죠? 




<이미지 출처 : Gartner, Nimble Storage vision drives to leadership position in Gartner Magic Quafrant>


시간을 조금 거슬러 올라가 2016년의 General-Purpose Disk Arrays 분야의 가트너 매직 쿼드런트 보고서를 보시겠습니다. 우측 상단의 리더 부문을 보시면 HPE는 여전히 최상위권에서 경쟁 중인데 그 아래쪽에 Nimble Storage라는 기업이 보입니다. 리더 부문에 새롭게 오른 스토리지 기업으로 당시 독자적인 기술력을 바탕으로 SSD와 HDD를 혼합한 하이브리드 형태의 스토리지를 앞세워 빠르게 성장하던, 업계에서 주목받는 기업이었습니다. 


2008년 미국에서 설립된 Nimble Storage(님블 스토리지)는 첫 리더 부문에 올랐던 2015년 당시에, 가트너 매직 쿼드런트 보고서의 리더 부문에 오른 기업 중 가장 역사가 짧은 기업이었다고 합니다. 2013년 미국 나스닥에 상장했고 2014년에 한국 지사를 설립하며 국내 시장에 진출했고, 글로벌 고객 수도 빠르게 증가해 2013년 글로벌 1,000개의 고객사가 2016년 9,000개로 늘어날 정도로 급격하게 성장했습니다. 이런 Nimble Storage를 HPE가 2017년 4월에 12억 달러를 주고 인수합니다.




<이미지 출처 : Blasting News, Hewlett Packard Enterprise acquires Nimble Storage for $1.09 billion>


그 이전인 2010년에 HPE는 스토리지 기업 3PAR를 인수해 x86 서버 위주의 비즈니스 포트폴리오를 스토리지 분야로 확장했습니다. 하지만 스토리지 분야의 실적은 그렇게 좋은 편은 아니었는데요. 2016년 HPE 스토리지 실적은 전년 대비 4% 감소, 2017년 1분기 실적은 전년 대비 무려 13%나 감소했습니다.(2017년 3월 9일 디지털데일리 기사) 하지만 x86 서버 실적은 줄곧 1위를 차지할 정도로 좋았죠.


때문에 x86 분야에서의 입지를 스토리지에서도 유지하고 싶었던 HPE는 스토리지 분야의 실적 개선을 위해, 그리고 그 당시 빠르게 성장하던 올플래시 스토리지 영역을 공략하기 위해 2017년 3월에 Nimble Storage 인수를 발표, 4월에 마무리합니다. 



<이미지 출처 : HPE, Gartner Names HPE as a Leader for General-Purpose Disk Arrays>


인수 후 나타난 결과는 위와 같습니다. 2017년 10월에 발표된 General-Purpose Disk Arrays 분야 가트너 매직 쿼드런트 보고서를 보면 HPE가 리더 부문 중 가장 높은 곳에 올라가 있는 것을 보실 수 있죠? 이는 Nimble Storage 인수 효과를 톡톡히 본 것으로 해석할 수 있을 것 같습니다. 스토리지 부문 실적 역시 크게 개선되어 2017년 32억 8천만 달러의 실적은 2018년 37억 6백만 달러로 13% 성장합니다.(HPE의 세부 실적은 여기서 확인하실 수 있습니다.)




결과적으로 Nimble Storage가 포함된 HPE의 스토리지 포트폴리오는 위와 같습니다. Nimble Storage는 All-Flash & Hybrid Storage 분야에서 AF(All Flash)와 HF(Hybrid, SSD + HDD) 스토리지 2종을, Hyperconverged Infrastructure 분야에서 dHCI 스토리지 1종을 제공합니다. 그리고 이어서 Nimble Storage의 경쟁사 대비 차별화된 특징에 대해 살펴보겠습니다.





2. Nimble Storage의 차별화된 특징



 1) Nimble Storage만의 고유한 아키텍처, CASL


Nimble Storage는 전통적인 스토리지 아키텍처가 아닌 CASL(Cache Accelerated Sequential Layout)이라는 고유한 아키텍처를 가집니다. 이 CASL 아키텍처 덕분에 Nimble Storage는 경쟁 제품들 대비 압도적인 성능을 발휘할 수 있어 업계에서 주목을 받게 된 것인데요. 어떤 특징을 가졌는지 간단히 요약해 보겠습니다. 


 

<이미지 출처 : Allshow TV, 여태까지 이런 스토리지는 없었다, HPE Nimble Storage>


먼저 기존의 전통적인 스토리지 아키텍처를 보겠습니다. 위와 같이 호스트, 즉 서버에서 다양한 유형의 워크로드 I/O가 스토리지로 들어오면 먼저 Cache에서 이 데이터를 저장합니다. 그 이후에 스토리지의 RAID 구조에 따라 개별 디스크에 분산 저장하는 형태라고 볼 수 있습니다. 




<이미지 출처 : Allshow TV, 여태까지 이런 스토리지는 없었다, HPE Nimble Storage>



하지만 기업에서는 데이터의 안정성 때문에 RAID 구조를 위와 같이 다양한 형태로 가져갑니다. 가장 기본인 RAID-0의 경우 서버로부터 1,000개의 I/O가 유입되면 스토리지에 꽂힌 디스크에도 1,000개의 I/O가 발생하고요. 속도가 빠른 대신 하나의 디스크에서 오류가 발생하면 RAID-0으로 구성된 모든 디스크의 데이터가 망가집니다.

RAID-1의 경우에는 미러링 기술을 통해 데이터를 동일한 디스크에 한 번 더 저장합니다. 덕분에 하나의 디스크가 망가지더라도 다른 디스크에 데이터가 온전히 살아있는 장점이 있는 반면 디스크가 RAID-0에 비해 짝수로 2배 이상 필요하다는 단점이 있죠. 그래서 서버로부터 1,000개의 I/O가 유입되면 스토리지에서는 2,000개의 I/O가 발생합니다.

RAID-5는 하나의 Parity를 두어 데이터를 디스크에 분산 저장하는 방식으로 RAID-5로 구성된 디스크 중 하나가 오류가 발생하더라도 데이터를 복구할 수 있습니다. 하지만 2개 이상의 디스크에 오류가 발생하면 복구할 수 없고 통상 5개의 디스크로 구성하고 4개의 디스크와 하나의 패터리 구조를 가져가기에 서버로부터 1,000개의 I/O가 유입되면 스토리지에서는 4,000개의 I/O가 발생합니다. 

마지막으로 RAID-6는 RAID-5 구조에 Parity를 하나 더 추가해서 Double Parity로 구성합니다. 덕분에 디스크가 2개까지 고장 나더라도 데이터를 복구할 수는 있지만 동일 용량 확보를 위해 RAID-5보다 더 많은 디스크가 필요하고요. 그래서 서버에서 1,000개의 I/O가 유입될 경우 RAID-6로 구성된 스토리지에서는 6,000개의 I/O가 발생합니다.




이처럼 전통적인 스토리지 아키텍처에서는 성능을 위해 RAID-0을 사용하자니 데이터 안정성이 떨어지고, 데이터 보호를 위해 미러링, Parity 기술을 사용하자니 스토리지 I/O가 2배, 4배 이상 늘어나 성능이 떨어지는 한계를 보입니다. 만약 성능도 빠르게 하고 안정성도 높이려면 많은 디스크가 필요하겠죠. 디스크가 많을수록 서버로부터 유입되는 다양한 유형의 I/O를 분산 처리할 수 있으니까요. 하지만 디스크 수가 늘어나니 일정 수준의  성능과 안정성을 위해서는 많은 비용이 발생하게 됩니다.

그래서 Nimble Storage는 어떻게 하면 스토리지 I/O를 줄여 전통적인 스토리지 아키텍처의 한계를 극복할 수 있을까에 대해 고민했고, 그 결과 탄생한 아키텍처가 바로 CASL(Cache Accelerated Sequential Layout)입니다. CASL이 기존 아키텍처와 어떻게 다른지 간단히 정리해 보겠습니다.




<이미지 출처 : Allshow TV, 여태까지 이런 스토리지는 없었다, HPE Nimble Storage>


앞서 소개한 사례와 마찬가지로 서버로부터 여러 유형의 I/O가 스토리지고 유입되면, CASL 아키텍처가 적용된 Nimble Storage 역시 먼저 Cache가 이 I/O를 받아 저장합니다. 그러고 나서 바로 디스크로 분산 저장하는 것이 아닌, 이 I/O를 한데 모아 몇 MB에서 수십 MB 단위의 큰 블록을 형성하는 병합 과정을 거칩니다. 이후 이 블록은 압축과 중복제거 과정을 거친 다음 Nimble Storage가 사용하는 RAID 기술인 Triple+ Parity로 구성된 디스크에 분산 저장됩니다.



<이미지 출처 : Allshow TV, 여태까지 이런 스토리지는 없었다, HPE Nimble Storage>


CASL 아키텍처에서는 위와 같이 서버로부터 1,000번의 I/O가 유입되면 스토리지에서는 고작 20번 정도의 I/O만 발생합니다. 앞서 말씀드린 I/O를 병합해서 큰 블록 단위로 만들고, 그 다음 압축과 중복제거를 통해 데이터의 용량을 대폭 감소시켜 저장하기 때문에 스토리지에서 발생하는 I/O를 획기적으로 줄일 수 있는 것입니다.

그리고 Nimble Storage의 HF 모델은 SSD 와 HDD가 21개 기준으로 구성되기 때문에 I/O가 21번 발생하고, AF 모델은 SSD 24개로 구성되기 때문에 I/O가 24번만 발생합니다. 즉, 호스트 I/O 대비 스토리지 I/O는 겨우 2% 수준으로 앞서 소개한 전통적인 스토리지 아키텍처의 가장 빠른 성능을 보이는 RAID-0의 비율이 100%인 것을 감안하면 어마어마한 수치임을 알 수 있습니다.




CASL의 핵심 내용인 가변 블럭 생성 -> 데이터 압축 -> 분산 저장을 나타낸 그림입니다. 이렇게 작은 크기의 여러 I/O를 가변 블럭으로 병합하고, 이것을 또 압축해서 분산 저장하기 때문에 WAN 구간 전송량의 점유율을 30 ~ 70%까지 절감시킬 수 있습니다. 따라서 원격지에 별도의 DR 센터를 구축한 경우라면 더 빠른 복구가 가능하고, 원거리에서 사내 애플리케이션을 사용해야 하는 경우 애플리케이션 처리 성능도 향상시킬 수 있겠죠?



CASL 아키텍처의 구조를 좀 더 자세히 나타낸 그림입니다. 위와 같이 총 5단계를 거쳐 데이터가 저장되고요. 1번 실시간 압축 단계에서 전체 데이터를 30~70%까지 줄이고 2번 데이터 병합 과정을 통해 쓰기 속도를 최대 10배까지 향상시키고 스토리지 I/O를 획기적으로 감축시켜 SSD 수명이 500% 이상 늘어납니다.

쓰기 성능뿐만 아니라 읽기 성능 역시 크게 향상됩니다. HF 모델의 경우 SSD를 Cache로 활용해 읽기 속도를 5배 이상 향상시키며 이 경우 96%의 히트율을 보입니다. 게다가 메타 데이터는 Cache에 존재하기 때문에 데이터 처리 속도 역시 빨라집니다.





<압축 및 중복제거 기능 활성화, 100% Randon I/O, R:W=5:5 기준 수치>

<이미지 출처 : Allshow TV, 여태까지 이런 스토리지는 없었다, HPE Nimble Storage>


이러한 CASL의 기존 스토리지 대비 비약적으로 향상된 수치들은 스토리지 제품들의 데이터시트에서 확연한 차이를 보입니다. 보통의 스토리지들은 압축과 중복제거를 거치면 스토리지 데이터시트에 고지되어 있는 성능 대비 훨씬 떨어지는 IOPS 성능을 보이는 것이 일반적이죠. 하지만 Nimble Storage는 CASL 아키텍처를 통해 압축과 중복제거가 활성화된 상황, 즉 보다 현실적인 상황을 기준으로 측정한 IOPS 성능을 보장합니다. 덕분에 실제 PoC에서도 데이터시트에 기재된 수치 대비 비슷하거나 오히려 더 높은 성능을 발휘하는 특징을 가집니다. 즉, 마케팅용 수치가 아니라는 것입니다.




<이미지 출처 : Allshow TV, 여태까지 이런 스토리지는 없었다, HPE Nimble Storage>


스토리지 I/O를 획기적으로 줄이는 CASL 아키텍처 덕분에 Nimble Storage의 하이브리드 모델인 HF 제품은 All-Flash 스토리지에 준하는 성능을 발휘합니다. 일반적으로 스토리지의 읽기와 쓰기 성능은 HDD일 경우 20ms, SSD일 경우 1ms 미만이 기준치인데 Nimble Storage의 HF 모델은 1ms 이하의 성능을 구현해 타사의 All-Flash 스토리지에 버금가는 성능을 기록했음을 위 사례에서 확인하실 수 있습니다.

앞서 서두에서 언급한 Nimble Storage의 하이브리드 스토리지가 각광받는 이유가 바로 이것입니다. CASL 덕분에 HDD를 혼합한 HF 제품으로도 타사 All-Flash 급의 성능을 발휘할 수 있으니 스토리지 구축에 필요한 비용을 많이 절감할 수 있겠죠? 일정 수준의 IOPS 확보를 위해 필요한 비용이 타사 제품 대비 훨씬 적게 들 테니까요.





Nimble Storage는 서버 I/O의 병합과 압축 및 중복제거를 통해 스토리지 I/O를 획기적으로 줄인 아키텍처에 더해 업계에서 가장 뛰어난 안정적인 구조의 Triple+ Parity RAID 구성 덕분에 디스크 수량과 관계없는 일정한 고성능을 보장함과 동시에 하이브리드 스토리지 성능을 All-Flash 급으로 구현할 수 있었습니다. 그리고 이는 기업의 스토리지 구축 비용 절감으로 이어진다는 것이 CASL 아키텍처의 특징이라고 요약할 수 있겠습니다.

그리고 이러한 특징 덕분에 Nimble Storage는 퍼블릭 클라우드 서비스 기업의 저비용 고성능 스토리지, 이커머스 기업의 MySQL DB 전용 스토리지, 1,000명의 사용자가 있는 의료 센터의 VDI 스토리지로 도입되어 성공적으로 운영되고 있습니다.







 2) RAID 기술의 정점, 업계에서 가장 안정적인 Triple+ Parity



앞서 CASL 아키텍처를 설명하면서 병합, 압축, 중복제거를 거친 I/O는 Triple Parity RAID로 구성된 디스크에 분산 저장된다고 말씀드렸습니다. 이 Triple+ Parity RAID 기술은 2개의 디스크 오류까지 복원할 수 있는, Parity가 두 개인 RAID 6보다 더 안정적인 기술입니다. 실제 HPE 내부에서 안정성을 계산하는 전문 도구로 측정 결과 위와 같이 RAID 5를 기준으로 삼았을 때 무려 466,350배나 더 안정적인 것으로 확인되었고요. 일반적으로 안정성이 검증됐다고 알려진 RAID 1-0 구성보다도 2,000배 이상 안정성이 높죠? 이와 같이 Nimble Storage는 현재 업계에서 가장 안정적으로 평가받는 RAID 기술인 Triple+ Parity가 적용되어 있습니다.



이 기술 덕분에 Nimble Storage는 업계에서 가장 안정적인 스토리지로 통합니다. 2014년부터 2020년까지 7년 동안 판매된 Nimble Storage의 디스크 교체 건수는 고작 7건이었고 데이터 손실은 0건, 데이터 손실이 없으니 당연히 서비스 영향도 0건, 실질적인 스토리지 장애율도 0.27%로 매우 낮게 측정되었습니다. 덕분에 Nimble Storage는 업계에서 가장 비용 효율적이면서도 높은 성능을 보장하는 스토리지임과 동시에 가장 안정성이 뛰어난 스토리지라는 평가를 받을 수 있는 것입니다.






 3) 성능저하 없는 백업

 


일반적으로 스토리지에서 백업을 위해 스냅샷을 찍을 때 COW(Copy On Write) 방식으로 스냅샷을 찍습니다. COW 방식의 경우 스냅샷을 생성할 때 원본 데이터에 대한 메타데이터만 활용하고 이 메타데이터를 통해 변경된 데이터를 추적하고 수정합니다. 따라서, 스냅샷 데이터는 일관성을 유지할 수 있으며 변경된 데이터만 저장하므로 스토리지 공간을 효율적으로, 즉 보다 스냅샷 데이터가 스토리지 용량을 적게 차지하는 장점이 있습니다. 하지만 데이터가 변경될 때마다 I/O가 발생하기 때문에(한 번의 데이터 변경 시 읽기 1회 쓰기 2회 I/O 발생) 지속적으로 스냅샷을 찍을 경우 성능이 일시적으로 하락하는 단점이 있죠.

반면 Nimble Storage는 ROW(Redirect On Write) 방식으로 스냅샷을 찍습니다. 스냅샷을 생성하고 추후 데이터 변경이 일어났을 때 읽기 1회 쓰기 1회 I/O만 발생합니다. COW 대비 쓰기 I/O가 1회 적기 때문에 그만큼 CPU 과부하를 줄일 수 있어 지속적으로 스냅샷을 생성하고 데이터가 변경되더라도 스토리지 성능 하락이 거의 없다는 특징을 가지고 있습니다. 즉 일관된, 성능 하락 없는 백업을 제공할 수 있다는 의미입니다.




그리고 Nimble Storage는 스냅샷을 비롯해 스토리지 이중화, 암호화, 데이터 복구, 압축 및 중복제거 등 백업을 위한 다양한 기능을 모두 무료로 제공합니다. Nimble Storage를 구매하는 것으로 전문 백업 소프트웨어에서 제공하는 많은 기능을 사용할 수 있다는 것입니다. 

특히 DR 환경 구축의 필수 요건인 스토리지 이중화의 경우 많은 백업 솔루션 기업들이 디스크 수량 혹은 용량에 따라 비용을 부과하거나 별도의 어플라이언스 장비를 통해서만 스토리지 이중화를 구현하는 데에 반해 Nimble Storage는 이것조차도 무료로 제공하는 것이 차별화된 특징이라고 할 수 있겠습니다.







 4) 높은 압축, 중복제거율 기반의 Usable 용량을 HPE가 보증


 


스토리지 데이터시트를 보면 실제 물리적 디스크 용량보다 훨씬 많은 Usable 용량을 확인할 수 있습니다. 이렇게 Usable 용량을 별도로 표기하는 이유는 스토리지에 적용된 압축과 중복제거 기술을 통해 물리적 디스크 용량보다 더 많은 데이터를 저장할 수 있다는 것을 나타내기 위함인데요. 하지만 이것은 데이터시트의 표기일 뿐 실제 그 결과를 담보하지는 않습니다. 때문에 기업에서 데이터시트에 기재된 Usable 용량만 믿고 스토리지를 도입했다가 실제 사용할 수 있는 용량과 차이가 나는 바람에 어쩔 수 없이 추가 스토리지를 도입해야 하는 상황도 비일비재한 것이 현실이죠.



하지만 HPE는 Store More Guarantee Letter라는 것을 발급해 Usable 용량을 보증합니다. Nimble Storage를 도입하는 기업의 스토리지 사용 용도와 데이터 저장 현황을 면밀히 분석해 Usable 용량을 측정한 다음 이것을 Store More Guarantee Letter에 기재해 무료로 기업에 제공합니다.

그래서 만약 60TB의 Usable 용량을 Letter를 통해 보증받았음에도 불구하고 실제 스토리지 사용 결과 50TB까지만 사용할 수 있었다면, HPE에서 10TB에 해당하는 스토리지를 제공하는 프로그램이라고 보시면 됩니다. CASL 아키텍처 기반의 수준 높은 압축 및 중복제거 기술에 대한 자신감을 한껏 드러내는 부분이 아닌가 싶네요. Nimble Storage를 도입하는 기업이라면 스펙 시트의 Usable 용량을 꼭 참고하시고 HPE에 Store More Guarantee Letter 발급을 요청하시기 바랍니다.







3. 스토리지 관리자의 든든한 지원군, HPE InfoSight


  


<이미지 출처 : HPE InfoSight for HPE SimpliVity Chalk Talk>




HPE가 Nimble Storage를 인수할 때 주목했던 것은 앞서 소개한 CASL 아키텍처입니다만 한 가지가 더 있습니다. 바로 AI 기반 스토리지 관리 자동화 및 예측 분석 도구인 InfoSight입니다. 이미 뛰어난 기술적 기반을 바탕으로 높은 성능을 구현한 Nimble Storage에 날개를 달아준 것이 이 InfoSight인데요. 인수 전에는 주로 중소기업용 스토리지 인프라에 초점이 맞춰져 있었지만 HPE 인수 후에는 HPE 스토리지 전 제품군에 InfoSight가 적용되어 대규모 데이터 센터 인프라, DB와 같이 고성능을 요구하는 애플리케이션을 위한 스토리지에도 활용되고 있습니다. 

그럼 구체적으로 HPE InfoSight가 어떤 특징을 가지고 있는지 좀 더 자세히 살펴볼까요?



  • AI/ML 분석을 통해 86%의 장애 예측 및 해결



 

HPE InfoSight는 전 세계에서 사용되고 있는 10,000여 대의 HPE Nimble Storage에서 오랫동안 수집된 다양한 유형의 데이터를 수집하고 있습니다. 이 데이터를 활용해 AI/ML 기반으로 분석해서 스토리지의 장애 징후를 감지하고 사전에 예방할 수 있는 가이드를 제공합니다. 2019년 5월에 발간된 ESG 보고서에 따르면, HPE InfoSight는 스토리지에서 발생할 수 있는 문제의 86%를 예측해서 해결 방안을 제시했다고 합니다. 



  • 장애 지원 티켓 73% 감소, 해결 시간 85% 절감, 레벨 3 지원 해결 속도 69% 개선



<이미지 출처 : HPE InfoSight AI Performance recommendations demo>



스토리지 운영 도중 관리자가 해결할 수 없는 장애가 발생할 경우, 관리자는 일반적으로 스토리지 제조사 엔지니어에게 도움을 요청합니다. 이것이 레벨 1 지원이고요. 지원 요청을 받은 레벨 1 엔지니어는 내용 파악 후 다시 레벨 2 엔지니어에게 전달하며 만약 레벨 2 엔지니어가 해결하기 어려운 문제라면 다시 상위의 레벨 3 엔지니어에게 내용이 전달됩니다. 이 과정을 에스컬레이션이라고 하는데, 이 때문에 고객은 스토리지 장애에 대한 지원을 받기까지 오랜 시간을 기다려야 하는 불편함이 있습니다.

HPE InfoSight는 예측 가능한 장애 지원 과정을 자동화했습니다. 그래서 레벨 1, 레벨 2에 해당하는 지원은 HPE InfoSight 차원에서 해결 가이드를 제공하며, 만약 레벨 3에 해당하는 장애라면 바로 레벨 3 엔지니어인 HPE Nimble Storage 전담 엔지니어에게 연결되기에 번거로운 에스컬레이션 절차가 없습니다. ESG 보고서에 따르면, HPE InfoSight 덕분에 장애 지원 티켓이 73%가 줄어들었고 접수된 티켓 해결 시간은 85% 감소, 레벨 3 상황 해결에 걸린 시간 역시 69% 개선되었다고 합니다.



  • 스토리지 용량 예측을 통해 증설 시점 및 구매 계획 수립




HPE InfoSight는 장애 예측 외에도 스토리지 사용량 분석을 통해 어느 시점에 얼마나 용량이 더 필요한지를 예측해 관리자에게 알려줍니다. 현재 스토리지의 성능과 함께 사용 용량 추이를 예측해 지표로 보여줌으로써 현재 상태를 기준으로 미래의 어느 시점에 용량이 부족해지는지 알려줍니다. 덕분에 관리자는 InfoSight에서 알려주는 시점을 토대로 스토리지 증설 계획을 세울 수 있고, 이는 데이터에 기반한 예측이기 때문에 경영진 설득도 이전보다 훨씬 수월하게 진행될 수 있을 것입니다.


여기까지 Nimble Storage만의 고유한 특징에 대해 자세히 살펴봤습니다. 그런데 아직 한 가지가 더 남았습니다. 지금까지 말씀드린 내용 외에 HCI와 관련된 Nimble Storage만의 장점이 또 있거든요. 이어서 계속 소개하겠습니다.







4. HCI 2.0을 위한 Nimble Storage, dHCI




<이미지 출처 : Nutanix, 하이퍼컨버지드 인프라는 무엇인가?>


HCI, Hyper Converged Infrastructure는 컴퓨팅 서버와 스토리지, 그리고 네트워크 이 3요소를 하나로 묶어 관리 소프트웨어와 함께 제공하는 플랫폼으로 온프레미스 데이터 센터에서 프라이빗 클라우드를 구축하고 운영할 수 있는 가장 진보된 플랫폼입니다. HCI는 기존의 3-Tier 아키텍처 기반 온프레미스 인프라에서 장비 추가에 따른 선형적인 성능 향상을 누리기 어려웠던 한계를 극복하고 스케일 아웃 형태로 성능과 용량 확장을 동시에 누릴 수 있는 획기적인 플랫폼이지만, 이 특징이 되려 HCI를 운영하는 기업들의 발목을 잡는 케이스가 생기고 있습니다.



<이미지 출처 : 랩터 인터내셔널, 하이퍼 컨버지드 인프라 EMC VCE VxRail 발매>


만약 HCI를 도입한 기업에서 컴퓨팅 성능만 향상시키고 싶을 경우 어떻게 해야 할까요? HCI 어플라이언스를 스케일 아웃 형태로 추가해야 합니다. 기업은 컴퓨팅 성능만 올리면 되는데 컴퓨팅과 스토리지가 함께 묶여있는 HCI 어플라이언스 특성상 컴퓨팅 성능과 함께 용량도 함께 늘어나기 때문에 과도한 비용 지출이 발생할 수 있습니다.

반대로 컴퓨팅 성능은 만족스럽지만 스토리지 용량 증설만 필요한 경우에도 기존의 HCI 어플라이언스로는 대응이 어렵습니다. 역시나 어플라이언스 장비를 추가함으로써 스토리지 용량 확장과 함께 성능도 확장되는 개념이기 때문에 어플라이언스 추가 비용을 지출해야 합니다.



그래서 HPE Nimble Storage는 dHCI, Disaggregated Hyperconverged Infrastructure(분리형 HCI)라는 새로운 개념의 플랫폼을 개발했습니다. 기존에 사용하던 컴퓨팅 서버, 즉 HPE ProLiant Gen 9 혹은 최신 제품인 Gen 10에 Nimble Storage만 추가해서 HCI로 구성해 사용할 수 있습니다. 


그래서 만약 기업에서 컴퓨팅 성능이 더 필요하면 서버와 스토리지 일체형 어플라이언스가 아닌 서버만 구매하면 되고, 스토리지 용량 증설이 필요할 경우 스토리지만 추가할 수 있습니다. 이렇게 해도 HCI 아키텍처가 유지되는 것이 dHCI의 특징입니다.




Nimble Storage는 dCHI를 통해 기업이 보다 적은 비용으로, 기존의 IT 인프라를 활용해서 HCI 플랫폼을 구성할 수 있도록 돕습니다. 반드시 고가의 HCI 어플라이언스를 구매하지 않아도 되고, 향후 확장 시 기업이 필요로 하는 분야만 선택해서 확장할 수 있기 때문에 HCI 도입의 가장 큰 진입 장벽인 비용 문제를 해결한, 차세대 HCI, HCI 2.0 플랫폼이라고 할 수 있겠습니다.






5. 결론 : 가용성 99.9999%, 업계 최고로 안정적인 스토리지


지금까지 소개한 Nimble Storage의 CASL 아키텍처, Triple+ Parity RAID, 성능저하 없는 백업 기능의 무료 제공, Usable 용량 보증, AI/ML 기반 운영 자동화 및 장애 예측 도구인 HPE InfoSight, HCI 2.0을 위한 dCHI와 같은 특징과 더불어 Nimble Storage를 사용하는 이유가 있습니다.




AF(All-Flash) 모델과 HF(Hybrid) 모델 모두 Unified Flash Fabric이라는 단일 아키텍처로 관리되기 때문에 AF와 HF로 이중화 구성을 할 수 있어 경쟁사 대비 최대 1/3 비용이 절감된 DR 환경을 구축할 수 있고요. Nimble Storage만의 3D NAND 최적화 설계 기술을 기반으로 SSD 수명 단축의 주범인 Write Amplification 발생을 최소로 줄여 SSD 수명을 7년 동안 보증합니다. 그리고 성능이 필요하면 성능만(Scale Performance), 용량이 필요하면 용량만(Scale Capacity), 성능과 용량 확장이 모두 필요하면 마치 HCI 어플라이언스처럼 Scale Out 형태로 성능과 용량 모두를 업그레이드할 수 있습니다.





이러한 다양한, 고유한 특징 덕분에 국내에서 Nimble Storage를 사용하는 고객 수는 100개를 넘었고, 2012년 7월부터 2018년 11월까지의 Nimble Storage 전체 고객을 대상으로 조사한 결과 평균 가용성 99.9999%를 기록했으며 연간 약 25초 정도의 다운타임만 발생했다고 합니다. 

연간 25초 다운타임이라는 것도 1년 중 갑자기 25초 동안 쭉 장애가 발생했다는 것이 아닌, 1년 동안 발생한 장애 시간을 한데 모은 것이 25초라는 것이기 때문에 스토리지 관리자는 미처 장애가 발생했는지도 알아차리기 어렵지 않을까요? 물론 장애가 발생할 경우 HPE InfoSight가 감지해서 자가 복구하는 케이스도 많기 때문에 관리자는 그저 다운타임을 이미 지나간 기록으로만 확인해야 하겠죠.

어쨌든 99.9999%라는 놀라운 수치는 Nimble Storage가 얼마나 안정적으로 운영되는 스토리지인지, 스토리지 관리자 입장에서 정말 마음 편히 사용할 수 있는 스토리지인지 단적으로 보여주는 것이 아닌가 싶습니다. 





지금까지 HPE가 왜 Nimble Storage를 인수했는지, Nimble Storage가 어떤 특징을 가지고 있기에 HPE 스토리지 부문의 구원투수로 등판해 All-Flash와 Hybrid 모델을 앞세워 스토리지 시장을 리드하고 있는지, dHCI를 통해 기존의 HCI가 가진 한계를 어떻게 극복했는지를 말씀드렸습니다. Nimble Storage에 대한 보다 자세한 내용이 궁금하신 분들은 아래의 사이트에서 확인해 보시기 바라며, 전문가에게 상담을 요청해 보시기 바랍니다.



이 콘텐츠가 기업에서 노후화된 스토리지 교체 혹은 증설, HCI 플랫폼 도입 등 온프레미스 인프라의 개선을 고민하시는 분들께 조금이나마 도움이 되셨기를 바랍니다. 끝!


4개의 댓글이 있습니다.

약 2년 전

자료 감사합니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 2년 전

내용 잘봤습니다 감사합니다

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 2년 전

좋은정보 감사합니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 2년 전

좋은 정보 감사드립니다!

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입