보고서 정보
주관연구기관 |
한국과학기술정보연구원 Korea Institute of Science and Technology Information |
연구책임자 |
정기문
|
참여연구자 |
박경석
,
박준영
,
손아영
,
조혜영
,
유찬희
,
김유선
,
정주빈
,
김수진
,
허의남
|
보고서유형 | 연차보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2023-12 |
과제시작연도 |
2023 |
주관부처 |
과학기술정보통신부 Ministry of Science and ICT |
연구관리전문기관 |
한국과학기술정보연구원 Korea Institute of Science and Technology Information |
등록번호 |
TRKO202400000465 |
과제고유번호 |
1711198495 |
사업명 |
한국과학기술정보연구원연구운영비지원(주요사업비) |
DB 구축일자 |
2024-06-26
|
키워드 |
클라우드 컴퓨팅.R&D 클라우드.클라우드 네이티브 어플리케이션.고성능 컴퓨팅.HPC 클라우드.Cloud Computing.R&D Cloud.Cloud Native Application.High Performance Computing.HPC Cloud.
|
초록
▼
Ⅳ. 연구개발결과
(1) R&D 클라우드 플랫폼 기술 개발
□ R&D 클라우드 플랫폼 기본 설계
○ 다양하고 고성능 자원이 요구되는 R&D 소프트웨어(HPC 소프트웨어)를 웹기반 클라우드 서비스를 제공할 수 있는 클라우드 플랫폼 구조 설계 및 개발
○ 공동 활용 및 타 클러스터 연동을 고려한 API기반 클라우드 플랫폼 개발
○ HPC Computing을 위해 분산 스토리지 및 IB 네트워크, 다기종 가속기 등을 지원할 수 있는 기능 개발
○ Openstack의 VM들과 Container, 그리고 플랫
Ⅳ. 연구개발결과
(1) R&D 클라우드 플랫폼 기술 개발
□ R&D 클라우드 플랫폼 기본 설계
○ 다양하고 고성능 자원이 요구되는 R&D 소프트웨어(HPC 소프트웨어)를 웹기반 클라우드 서비스를 제공할 수 있는 클라우드 플랫폼 구조 설계 및 개발
○ 공동 활용 및 타 클러스터 연동을 고려한 API기반 클라우드 플랫폼 개발
○ HPC Computing을 위해 분산 스토리지 및 IB 네트워크, 다기종 가속기 등을 지원할 수 있는 기능 개발
○ Openstack의 VM들과 Container, 그리고 플랫폼 관리기능들을 Kubernetes 중심의 통합관리 환경 구축
□ R&D 플랫폼 주요 기능 구현
○ SCIaaS(SCIence as a Service)
- SCIaaS에서 HPC Job 또는 워크플로우 작업 수행을 GUI 기반의 작업 생성 위자드인 SCIaaS Studio 개발
- 계산과학 소프트웨어를 Kubernetes 컨테이너로 설치 및 실행할 수 있으며 클러스터 기반의 병렬 또는 분산 처리가 가능한 SCI-App 개발
- 사용자에게 웹기반 개발환경 및 설정했던 Container 환경을 Container 이미지로 저장 및 배포할 수 있는 Dev&Dep 환경 구축
○ Virtual Server Service
- 단일 VM 및 Container 생성과 Linux Cluster, Slurm Cluster 등을 자동생성하는 HPC IaaS 구축
- 생성한 VM 및 Container 기반의 R&D 클라우드 플랫폼 서비스과 연동
○ DaaS
- 외부 저장소와 연결할 수 있는 연동 인터페이스 개발
- GUI 기반 R&D 클라우드 플랫폼의 저장소에 대한 파일 관리 서비스 제공
○ PAM 기반 서비스 인증
- 클러스터/서비스 연계를 위해 PAM 기반 클러스터/서비스 인증 기능 개발
□ R&D 클라우드 플랫폼 KI Cloud 적용 절차 및 현황
○ 클라우드 플랫폼 전환을 위한 클라우드 마이그레이션 방법 조사
○ R&D 클라우드 플랫폼 마이그레이션을 위한 단계 및 계획 수립
□ R&D 플랫폼 기술 연구
○ R&D 클라우드 플랫폼 소프트웨어 구성 선정
- R&D 클라우드 플랫폼 구축을 위한 소프트웨어 현황 분석 및 개선 방안 마련
- 소프트웨어간 호환성, 공식 지원(EOS) 기간, 안정성을 고려하여 소프트 웨어 및 버전 선정
○ 클라우드기반 HPC Task 수행을 위한 MLOps 요소기술 연구
- 효율적인 HPC Task 배치를 위한 HPC Task Data 분류 및 패턴 분석
- 워크로드 및 자원 상황를 고려하여 ML기반의 Task Allocation 기법 연구
- MLOps 성능 테스트를 위한 테스트베드, 모니터링 환경 구축 및 테스트수행
○ R&D 플랫폼 기술 개발 및 활용 방안
- R&D 클라우드 플랫폼을 공동활용 계획 수립
□ HPC 클라우드 기술 연구
○ HPC 클라우드 스토리지 관련 연구
- RADOS 벤치마크를 활용한 Ceph 분산 스토리지 성능 측정 및 분석
- R&D 클라우드 플랫폼과 Luste 연동을 위한 테스트베드 구축 및 테스트
○ HPC 클라우드 기술 동향
- HPC 클라우드에 대한 국내외 시장, 산업, 기술 동향 조사
- HPC 클라우드 성능 향상을 위한 DPU, CXL 기술 조사
(2) 클라우드 네이티브 기반의 R&D 어플리케이션 서비스 연구개발
□ R&D 어플리케이션 서비스 연구 및 수요발굴
○ 연구 도메인별 소프트웨어 및 어플리케이션 조사 단계 및 계획 수립
○ 분자동역학 기반의 단백질 분석 방법 및 활용사례, 주요 소프트웨어 조사
○ 입자 물리학에서의 HPC 활용 방법 및 사례, 주요 소프트웨어를 조사
○ 나노 소재 분야에서 HPC 활용 방법 및 사례, 주요 소프트웨어를 조사
○ 공학 및 바이오 분야에서 HPC 활용 방법 및 사례, 주요 소프트웨어를 조사
○ 인공지능 모델 개발 및 서비스 최적화를 위한 모델 병렬화 기술 개발
- 클라우드 환경에서 인공지능 모델 및 최적화 기술 연구
- 모델 병렬화 기술 분석 및 모델 병렬화 방법간의 성능 비교 수행
- 클라우드 환경에서 AI 모델 서비스 제공을 위한 MLOps 서비스 시스템개발 및 서비스 실증 수행
□ R&D 어플리케이션 서비스 개발
○ SCIaaS Studio를 활용한 Web기반 OpenFOAM 어플리케이션 개발
○ SCIaaS Studio를 활용한 Slurm Cluster기반의 Paraview 어플리케이션 개발
○ Slurm Cluster를 선택하여 병렬처리가 가능한 JupyterLab 어플리케이션 개발
○ AIaaS(AI as a Service)
- R&D 클라우드 플랫폼 기반 AI 모델 생성 및 배포 개발 기능 구축
- Feature Store를 통해 AI 메타데이터 저장 및 제공 기능 개발
○ Quantum 소프트웨어 – QaaS (Quantum Computing as a Service)
- 연산을 위한 워크플로우 및 데이터 처리 절차에 시각화 기능 개발
- 연산 수행에 대한 회로 작업 상태 및 성공 여부, 오류 등에 대한 모니터링 개발
(출처 : 요약문 8p)
Abstract
▼
Ⅳ. Result of the study
(1) R&D cloud platform technology development
□ Basic design of R&D cloud platform
○ Design and development of a cloud platform structure that can provide web-based cloud services for R&D software (HPC software) that requires diverse and high-performance resources
Ⅳ. Result of the study
(1) R&D cloud platform technology development
□ Basic design of R&D cloud platform
○ Design and development of a cloud platform structure that can provide web-based cloud services for R&D software (HPC software) that requires diverse and high-performance resources
○ Development of an API-based cloud platform considering joint use and interconnection with other clusters
○ Developing functions that can support distributed storage, IB network, and multiple types of accelerators for HPC computing
○ Establish an integrated management environment centered on Kubernetes for OpenStack’s VMs, containers, and platform management functions.
□ Implementation of major R&D platform functions
○ SCIaaS (SCIence as a Service)
- Developed SCIaaS Studio, a GUI-based job creation wizard to perform HPC jobs or workflow tasks in SCIaaS
- Development of SCI-App that can install and run computational science software as a Kubernetes container and enable cluster-based parallel or distributed processing
- Establish a Dev&Dep environment that allows users to save and distribute the web-based development environment and the configured container environment as a container image.
○ Virtual Server Service
- Establishment of HPC IaaS that automatically creates a single VM and container and Linux Cluster, Slurm Cluster, etc.
- Linked with created VM and container-based R&D cloud platform service
○ DaaS
- Development of an interconnection interface that can connect to external storage
- Provides file management service for storage of GUI-based R&D cloud platform
○ PAM-based service authentication
- Development of PAM-based cluster/service authentication function for cluster/service linkage
□ R&D cloud platform KI Cloud application procedure and status
○ Investigation of cloud migration methods for cloud platform conversion
○ Establish steps and plans for R&D cloud platform migration
□ R&D platform technology research
○ R&D cloud platform software configuration selection
- Analyzing software status and preparing improvement plans to build an R&D cloud platform
- Selection of software and version considering inter-software compatibility, official support (EOS) period, and stability
○ Research on MLOps element technology for cloud-based HPC task performance
- HPC Task Data classification and pattern analysis for efficient HPC Task Placement
- Research on ML-based Task Allocation techniques considering workload and resource situations
- Establishment and testing of test bed and monitoring environment for MLOps performance testing
○ R&D platform technology development and utilization plan
- Establishment of a plan to jointly utilize the R&D cloud platform
□ HPC cloud technology research
○ Research on HPC cloud storage
- Ceph distributed storage performance measurement and analysis using RADOS benchmark
- Establishment and testing of a testbed for linking the R&D cloud platform and Luste
○ HPC cloud technology trends
- Research on domestic and international markets, industries, and technology trends for HPC cloud
- Investigation of DPU and CXL technologies to improve HPC cloud performance
(2) Cloud native-based R&D application service research and development
□ R&D application service research and demand discovery
○ Software and application research steps and plan establishment for each research domain
○ Molecular dynamics-based protein analysis methods, use cases, and significant software survey
○ Investigate HPC utilization methods, cases, and significant software in particle physics
○ Investigate HPC utilization methods, cases, and significant software in the field of nanomaterials
○ Investigate HPC utilization methods, cases, and significant software in engineering and biofields
○ Development of model parallelization technology for artificial intelligence model development and service optimization
- Research on artificial intelligence models and optimization technologies in a cloud environment
- Analyze model parallelization technology and perform performance comparison between model parallelization methods
- Development of MLOps service system and performance of service demonstration to provide AI model service in a cloud environment
□ R&D application service development
○ Web-based OpenFOAM application development using SCIaaS Studio
○ Slurm Cluster-based Paraview application development using SCIaaS Studio
○ Select Slurm Cluster to develop a JupyterLab application capable of parallel processing
○ AIaaS (AI as a Service)
- Establishment of AI model creation and distribution development function based on an R&D cloud platform
- Developed AI metadata storage and provision function through Feature Store
○ Quantum Software – QaaS (Quantum Computing as a Service)
- Development of visualization functions in workflow and data processing procedures for calculations
- Development of monitoring for circuit operation status, success, errors, etc. for operation performance
(source : Summary 14p)
목차 Contents
- 표지 ... 1
- 제 출 문 ... 2
- 연차보고서 초록 ... 3
- 요 약 문 ... 4
- Summary ... 12
- CONTENTS ... 17
- 목차 ... 18
- 표목차 ... 19
- 그림목차 ... 20
- 1. 연구개발과제의 개요 ... 25
- 가. 연구개발 최종 목표(2021-2026 기준) ... 25
- 나. 국내·외 기술개발 현황 ... 26
- 다. 단계별 연구개발 로드맵 ... 47
- 라. 단계별 연구개발과제 목표 및 내용 ... 48
- 마. 전략목표(대과제)-성과목표(중과제)-성과지표(세부과제) 성과 연계도 ... 49
- 바. 추진전략 및 협력 네트워크 ... 49
- 사. 2023년 대표성과 ... 51
- 아. 2023년 실적 및 2024년 계획 ... 52
- 2. 연구개발과제의 수행 과정 및 수행 내용 ... 53
- 3. 연구개발과제의 수행 결과 ... 130
- 가. 정성적 연구개발성과 ... 130
- 나. 정량적 연구개발성과 ... 133
- 다. 계획하지 않은 성과 및 관련 분야 기여사항 ... 140
- 4. 연구개발성과의 관련 분야에 대한 기여 정도 ... 141
- 5. 연구개발성과의 관리 및 활용 계획 ... 142
- 6. 참고문헌 ... 144
- 끝페이지 ... 151
※ AI-Helper는 부적절한 답변을 할 수 있습니다.