AIOps의 사례 & 전망

출처 : www.airtimes.kr
IBM이 IT 인프라의 이상을 실시간으로 자율 감지하고 진단, 대처하는 프로세스를 인공지능(AI)으로 자동화하는 '왓슨 AIOps (IBM Watson AIOps)’를 최근 선보였다. 이를 통해 기업은 인프라 레벨의 자동화를 도입할 수 있다. 설명 가능한 AI를 개방형 플랫폼에 배포하여 미션 크리티컬 워크로드에서 평가, 진단 및 해결한다.
머신러닝, 자연어 이해, 설명 가능한 AI 등을 활용해 IT 운영을 자동화하는 새로운 왓슨 AIOps는 추적 가능한 AI를 사용하여 팀과 이해 관계자가 미션 크리티컬 워크로드에 대한 AI 기반 권장 사항 및 통찰력을 신뢰하도록 돕는다.
특히, 왓슨 AIOps를 통해 최고 정보 책임자(CIO)는 보다 정확하게 미래 결과를 예측하고 구상해 더 큰 가치를 창출하는데 자원을 집중하고, 보다 오랫동안 지속될 수 있는 반응성이 뛰어난 지능형 네트워크를 구축할 수 있다.
코로나 시대로 인한 비대면 채널의 수요 증대와 기업이 관리해야 하는 데이터 양이 늘어남에 따라 IT 관리의 상당 부분을 AI를 통해 자동화 해야 하는 것이다.
또한 재택 근무와 포스트 코로나 시대에 있어서 높은 업무 효율을 기대할 수 있을 것이다.

ServiceNow는 이스라엘에 기반을 둔 AIOps 회사 인 Loom Systems를 인수 한다고 발표 했습니다.
Loom Systems 는 2015 년 샌프란시스코에 등록 된 본사를 두고 설립되었습니다. 핵심 제품은 고객이 영향을 받기 전에 IT 사고를 예방할 수있는 AIOps 기반 로그 분석 솔루션 인 Sophie라는 브랜드입니다. 평이한 영어로 해결 방법을 제공하므로 사고 원인을 쉽게 이해할 수 있습니다.
출시 이후 Loom Systems는 PitchBook 데이터에 따라 1,600 만 달러의 자금을 조달했습니다. 2019 년 11 월에는 기존 투자자 인 JVP, Meron Capital 및 Global Brain Corporations가 관리하는 31Ventures 글로벌 혁신 펀드의 참여로 Flint Capital에서 1,000 만 달러를 모금했습니다.

AIOps는 IT 관리의 중요한 측면이 되었습니다. 본질적으로 인공 지능을 기존 IT 운영에 적용하는 것입니다. 다른 모든 도메인과 마찬가지로 AI는 시스템 운영 및 관리에 상당한 영향을 미칩니다. AI의 힘이 운영에 적용되면 인프라 관리 방식이 재정의됩니다.
IT 인프라는 많은 데이터를 생성합니다. 섀시의 온도에서 API 호출의 지연 속도에 이르기까지 서로 다른 스택 계층에서 데이터를 수집 할 수 있습니다. 이 데이터를 집계, 정규화 및 분석하면 통찰력을 얻을 수 있는 풍부한 소스가 됩니다.

잘 설계된 AIOps 플랫폼 인 Loom System의 Sophie에는 5 가지 주요 기능이 있습니다.
1) 데이터 수집 및 구문 분석 -구조화되고 반 구조화 된 로그 및 메트릭은 인바운드 데이터를 그룹화 및 분류에 사용할 수 있는 형식으로 구문 분석하고 정규화 하는 AIOps 플랫폼으로 수집됩니다.
2) 이상 탐지 및 시각화 -정규화 된 로그 및 측정 항목 집합은 이상 값과 비정상적인 패턴을 식별하도록 훈련 된 정교한 기계 학습 모델을 거칩니다. 플랫폼은 이상을 감지하고 시각화를 위해 대시 보드를 통해 표면화 합니다.
3) 상관 관계 및 근본 원인 분석 -AIOps 플랫폼의 실제 가치는 상관 관계 및 근본 원인 탐지에 있습니다. Loom System은인지 추론에 의존하여 교차 환경 및 교차 애플리케이션 문제를 감지하여 자동화 된 근본 원인 분석을 수행합니다.
4) 교정-Sophie 는 사고를 유발 한 배경과 이유를 명확하게 설명하는 통찰과 설명을 일반 영어로 생성 할 수 있습니다. IT 팀에 가능한 해결책을 추천 할 수도 있습니다.
5) 예측 티켓팅 -Sophie는 이전 티켓에서 학습하고 패턴을 정규화 된 로그 및 메트릭과 연관시켜 사용자가 프로세스를 시작하기 전에 문제에 대한 티켓을 자동으로 열도록 훈련 받았습니다. 이렇게 하면 MMTD (Mean Time To Detection)가 줄어 듭니다.

IT 서비스 관리 (ITSM) 및 IT 운영 관리 (ITOM)의 거의 모든 주요 업체가 AIOps에 투자하고 있습니다. 최근 VMware는 VeloCloud 기반 LAN 및 WAN 배포에 대한 종단 간 모니터링 및 문제 해결 기능을 제공하는 인텔리전스를 제공하기 위해 Nyansa를 인수했습니다. 작년에 시장은 Splunk가 SignalFX를 인수하고 New Relic이 SignifAI를 인수하는 것을 목격했습니다.
Loom Systems를 인수함으로써 Service Now는 고객 데이터를 분석하고 자동화를 통한 교정을 가속화하며 L1 사고 해결과 관련된 수동 프로세스를 줄일 수 있게되었습니다.

출처 : forbes