주요기능
  • 비너스는 기본적으로 슈퍼컴퓨터 및 연관 시스템 에 대해서 모니터링 기능을 제공하고 슈퍼컴퓨터 관련 기능을 HPC 시스템에 맞게 최적화 하여 효율적인 운영 및 가용성을 최대화 할 수 있도록 기상청 슈퍼컴퓨터의 관리에 최적화된 분석 및 통계 정보를 제공 합니다.
  • 기존 비너스의 대시보드에 슈퍼컴퓨터의 주요 지표와 로그인 서버를 결합하여 슈퍼컴퓨터를 통합 하여 모니터링 할 수 있는 화면을 제공 합니다. VINUS 통합 대시보드는 사용자별, 시간별, 그룹별 이벤트 및 노드별 성능 및 각 자원의 장애 자산 현황이 등으로 표현 됩니다. 또한 각 이벤트에 대한 상세 정보를 Drill –Down 기능으로 즉각 원인 단까지 분석 확인할 수 있어 운영자의 장애 대응 시간을 획기적으로 단축 시켜 줍니다.
  • 1. 그룹별 상황판
    • 그룹별 이벤트 종합 현황 슈퍼컴퓨터에 각 요소를 그룹화하여 관리 합니다,(해당 그룹을 클릭하면 자세한 세부 이벤트 현황을 파악할 수 있습니다.)
  • 2. 상세모니터링 지표
    • 업무별/클래스별/자산별/사간대별(모니터링 상세내역을 확인할 수 있음)
  • 3. 작업 벨트게이지
    • 전일 작업에 대한 그룹별 사용량, 사용자별 작업상태, 라이선스 사용량 등을 모니터링 할수 있습니다.
  • 4. 이벤트 발생내역
    • 실시간 이벤트내역 (시간/ 일자/ 클래스/ 심각도별 이벤트 항목 및 내용을 확인)
  • 모든 화면에서 노드 또는 대상 항목을 클릭 하면 해당 자원의 실시간 성능 정보, 이벤트 현황, 장애 현황, 자산 현황, 이벤트 설정정보, 장애설정 정보, 에러로그 설정정보, 슈퍼컴퓨터에 관련된 현황 정보등을 확인 할 수 있는 화면을 제공 합니다.
  • 1. 자산정보 – 1시간단위수집
  • 2. 이벤트발생내역-현재 발생한 이벤트 내역
  • 3. 이벤트설정정보-전체 이벤트설정정보제공
  • 4. 장애설정정보-장애이벤트설정정보
  • 5. 연관자산정보-자산 목록을 하이라키 구조로 제공
  • 6. 자산변동정보-자원변동에따른 히스토리제공
  • 7. 장애내역-장애내역및 방애 진행 현황 파악
  • 8. 시스템로그발생내역-지속적인 이벤트 관리
  • 9. 슈퍼컴퓨터 구성정보
  • 10. 가상화 자원-해당자원 및 하이라키 구조의 성능제공
  • 11. 물리서버성능정보-해당 자원의 상세 성능내역
   
  • 기본적으로 제공 하는 성능과 추가적으로 수집된 성능을 다양한 방식으로 실시간 모니터링 및 데이터를 분석 하여 모니터링 하는 기능을 제공 합니다. 실시간 성능 – 이전 기준 시간 대비 증감 현황 표시 ▲▼ 급등급락 표시 ↑↓ 합니다.
  • 해당 기간 동에 수집된 성능의 데이터가 건수100개중 데이터가 100%~90% 에 몇 개가 랭크되는지 분석하여 전체 시스템 운영 시간중 CPU 성능이 기준을 초과하는 경우를 파이 차트로 제공하여 성능분석에 효율을 높임
  • 실시간 성능 화면에 특정 자원 지표 클릭 → 해당 자원의 당일 성능 정보 그래프 제공 → 그래프에 CPU 점유가 높은특정 시점클릭 → 특점 시점의 CPU TOP10, MEM TOP 10제공 → 특정 프로세스 CPU 점유율 클릭시 → 해당 프로세스의 CPU,MEM 점유율 그래프 확인
  • 슈퍼컴퓨터 모니터링에 필요한 데이터를 취합하여 실시간 현황, 기간별 통계분석, 기간별 추이 분석 기능을 제공 합니다.
  • 시스템 장애 관리를 위한 장애 등급에 따른 실시간 알림기능, 장애상태 및 처리시간, 장애 사후 관리등 장애 이력관리 기능을제공합니다. 장애 이력 관리 기능을 활용하여 기 발생된 장애에 대한 조치내용등을 검색할 수 있습니다.
  • 장애 종류 및 등급에 따른 실시간 뷰
    • 장애 분류 등급 및 Class에 따른 장애 발생 현황을 통합 화면으로 제공합니다. 보고자 하는 등급을 선택하여 등급이 높은 장애 만을 반영하여 볼 수 있습니다. 각 상태 아이콘을 클릭하면 해당 등급 및 Class에 대한 세부 화면을 볼 수 있습니다.
  • 장애상태 및 처리 시간 등 장애 프로세스 관리
    • 장애 관리가 필요한 이벤트 들에 대하여 별도로 장애 관리를 수행 할 수 있습니다. 장애 처리 절차를 통하여 처리완료 될 때까지의 시간이 자동으로 기록되며 추 후 서비스 레벨을 평가하는 자료로 활용 될 수 있습니다. 처리된 내용은 기록으로 보관하여 조회 할 수 있고 추후 동일 장애 발생시 참조하여 처리 할 수 있습니다.
  • 장애 이력관리 기능 제공
    • 장애 프로세스를 통하여 처리된 내용은 이력관리 기능을 통하여 조회하여 볼 수 있습니다.
  • Vinus는 성능 보고서 부분을 별도로 만들어 슈퍼컴퓨터 자원, 물리장비등을 구분하여 수집 항목별 일일보고서와 기간별 보고서 기능을 제공합니다. 기간별 통계보고서를 제공하여 운영 보고서를 작성시 보고 자료가 되는 자료를 제공 합니다. 제공되는 메트릭으로는 CPU, MEMORY, SWAP, RUNQUE, PAGE IN, PAGE OUT, PACKET IN, PACKET OUT, NET IN, NET OUT, LOAD AVG 등의 정보를 제공합니다. 이벤트, 장애관련 보고서는 모든 메뉴에 엑셀, 워드, HTML 변환 기능을 제공합니다.
  • 사용자별 시스템 접속 횟수에 대한 통계/ 분석 기능을 제공합니다.
  • RACK용 상황판을 제공 합니다.
  • 비너스는 관리도구를 통해 모든 기능을 설정 하고 관리 합니다. 대시보드 접속 사용자, 슈퍼컴퓨터에 해당하는 각종 지표에 대해 임계치를 설정 하고 이벤트 발생, 생사감시 등록, 각종 포트 생사감시, 장애설정, 알림 설정등 다양한 기능을 제공 합니다.
항목 설명
환경설정 사용자관리/설정 – 사용자를 관리 등록하고 사용자에게 그룹별 권한, 메뉴접근권한, 사용기능제안 등을 제공합니다.
그룹관리/설정 – 모니터링 그룹을 설정하고 그룹에 자원과 사용자를 할당할 수 있는 기능을 제공합니다.
슈퍼컴퓨터 접속자 관리 – 슈퍼컴퓨터에 접속 하는 사용자에 대해 관리 하는 화면 입니다.
이벤트 관리 클래스관리 등록 – 모니터링 시스템에서 사용하는 이벤트종류(CLASS) 관리 기능을 제공합니다.
심각도 관리등록 – 모니터링에서 사용하는 심각도(SEVERITY)를 관리 기능을 제공합니다.
성능임계치 관리 – 모든 자원의 성능 임계치 정보 이벤트 등록 관리 기능을 제공합니다.
PING 이벤트 관리 – 모니터링 자원의 PING 생사관리 이벤트 등록 관리 기능을 제공합니다
PORT 이벤트 관리 – 모니터링 자원의 특정 포트 생사 이벤트 등록 관리 기능을 제공합니다.
FILE 이벤트 관리 – 파일생성유무, 파일 필터링등의 이벤트 등록 관리 기능을 제공합니다.
DB 이벤트 관리 – 사용자가 쿼리를 등록하여 이벤트 등록 관리 기능을 제공합니다
PROCESS 이벤트 관리 – 모니터링 자원의 프로세스, 서비스 이벤트 등록 관리 기능을 제공합니다.
SYSTEM 이벤트 관리- 이중화 이벤트 등록 관리 기능을 제공합니다.
이벤트 템플릿 – 기존에 등록되어있는 자원에 모든 이벤트를 신규 자원에 일괄 등록하는 기능을 제공합니다.
윈도우 이벤트 관리 – 윈도우에서 발생한 이벤트 목록에 대해 모니터링 이벤트로 발생 시키는 기능을 제공합니다.
윈도우 EVT 목록 – 모니터링 이벤트로 발생한 윈도우 이벤트에 대한 목록을 제공합니다.
LINUX 이벤트 관리 – 현재시간 기준 1분전 데이터에 지정된 문자열이 발생한 경우 이벤트를 발생시키는 기능을 제공합니다
장애 관리 장애 설정 등록 – 발생한 이벤트를 심각도 & 클래스 & 문자열 AND 조건으로 장애로 등록시키는 조건을 등록 관리 기능을 제공합니다.
인벤토리 관리 자원관리 – 모니터링 자원을 관리 등록하는 기능을 제공합니다.
문자메일관리 서버 알람 관리/설정 – 모니터링 자원의 이벤트에 따라 문자, 이메일등을 전송하기 위한 설정을 관리 하는 기능을 제공합니다.
사용자 문자 메일 발송-모니터링 시스템 사용자에게 문자 및 메일을 발송하는 기능을 제공합니다.
문자 메일 발송 내역 – 이벤트 발생으로 전송한 문자 및 메일 발송 목록을 제공합니다.
DashBoard설정 그룹Display 설정 – 종합상황판에 표시할 그룹을 설정하는 기능을 제공합니다.
GRAPH Display 설정 – 종합상황판에 표시되는 그래프를 설정하는 기능을 제공합니다.
  • 비너스에서 기본 대시보드를 제공 하지만 전체적인 현황에 대해 파악 할수 있는 별도의 개발 대시보드를 발하여 제공 합니다. 슈퍼 컴퓨터의 작업 상태, 작업 대기 원인 분석등 다양한 슈퍼컴퓨터의 정보를 한눈에 확인 할 수 있는 대시보드를 개발 대시보드를 구축 합니다.