최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
DataON 바로가기다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
Edison 바로가기다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
Kafe 바로가기주관연구기관 | 아콘소프트주식회사 |
---|---|
연구책임자 | 김진범 |
참여연구자 | 신상철 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2024-02 |
과제시작연도 | 2023 |
주관부처 | 과학기술정보통신부 Ministry of Science and ICT |
과제관리전문기관 | 정보통신기획평가원 Institute of Information&Communications Technology Planning&Evaluation |
등록번호 | TRKO202400004317 |
과제고유번호 | 1711193985 |
사업명 | ICT미래시장최적화협업기술개발 |
DB 구축일자 | 2024-07-17 |
키워드 | 기계학습 모델 운영관리.자동화된 모델 파이프라인.자동화된 지속적 배포/지속적 통합 파이프라인.지속적 모니터링.클라우드 네이티브.machine learning model operation management.automated model pipeline.automated CI/CD pipeline.continuous monitoring.cloud native. |
※ 연구개발 목표 및 내용
◎ 최종 목표
네이티브 클라우드 자동화된 기계학습 시스템 및 모델 운영·관리 솔루션(MLOps)]을 개발하고 서비스형인 MLOps SaaS 서비스로 전환
◎ 전체 내용
1년차
● 기계학습 데이터 수집 및 모델 개발 시스템 설계
● 기계학습 모델 운영 관리 시스템 설계
2년차
● 클라우드 네이티브 자동화된 기계학습 시스템 및 모델 운영·관리 솔루션의 설치형 플랫폼 개발
● 개발 시스템의 통합 시제품 개발
3년차
● MLOps솔루션의 서비스형
※ 연구개발 목표 및 내용
◎ 최종 목표
네이티브 클라우드 자동화된 기계학습 시스템 및 모델 운영·관리 솔루션(MLOps)]을 개발하고 서비스형인 MLOps SaaS 서비스로 전환
◎ 전체 내용
1년차
● 기계학습 데이터 수집 및 모델 개발 시스템 설계
● 기계학습 모델 운영 관리 시스템 설계
2년차
● 클라우드 네이티브 자동화된 기계학습 시스템 및 모델 운영·관리 솔루션의 설치형 플랫폼 개발
● 개발 시스템의 통합 시제품 개발
3년차
● MLOps솔루션의 서비스형 SaaS 제품 개발
○ 주요 개발 내용
- 조직 내외부의 정형데이터와 비정형데이터를 자동으로 수집 및 연계할 수 있는 아키텍쳐 개발
- 데이터 전처리, 데이터 레이블링 및 검증을 하는 데이터 준비 시스템 개발, 기계학습 모델을 개발
- 모델을 테스트, 빌드하는 오케스트레이티드 파이프라인을 개발
자동화된 ML(기계학습) 파이프라인을 빠르고 안정적으로 업데이트 할 수 있도록 CI/CD 기능을 갖는 시스템 개발.
- 모델(데이터) 버전관리, 모델 거버넌스, 모델 모니터링, 모델 보안 관리, 리소스 모니터링 구성요소를 갖춘 기계학습 모델 운영 관리 시스템(ML Ops)의 구성요소를 분석하고 핵심기능을 개발
- 1, 2차년도의 분석·설계·개발 프로그램을 통합하여 [클라우드 네이티브 자동화된 기계학습 모델 개발 시스템 및 모델 운영·관리 솔루션]을 시제품으로 개발
- 2단계에서 1단계 개발 솔루션의 SaaS 서비스형 제품 개발
o 핵심기술
- ML 파이프라인 자동화 기술
모델을 지속적으로 학습시키는 기술을 말하며, 프로덕션 단계에서 모델을 재학습시키는 프로세스를 자동화하여 예측 서비스를 지속적으로 제공(파이프라인 트리거, 메타데이터 관리, 자동화된 데이터 및 모델 검증 단계를 포함)
- CI/CD 파이프라인 자동화 기술
프로덕션 단계에서 패키지화된 파이프라인을 빠르고 안정적으로 업데이트하는 기능이며, 데이터 과학자가 피처 추출, 모델 아키텍처, 하이퍼파라미터에 대한 새로운 아이디어를 구현하고 새 파이프라인 구성요소를 대상 환경에 자동으로 빌드, 테스트, 배포할 수 있도록 지원하는 기술
- CM(지속적 모니터링) 기술
모델 모니터링 데이터와 컴퓨팅 리소스 모니터링 데이터를 통합한 지속적 모니터링 기능으로 모델 모니터링 과정에서 측정된 모델 학습 시 지연시간, 성능시간을 ML 시스템 운영에서 생성되는 매트릭스 데이터와 결합하여 최적의 시스템 리소스 할당과 모델 학습 시간을 찾아내기 위하여 다변량 변수를 갖는 시계열 분석(Multivariate Time Series Forecasting) 방법으로 LSTM 모델을 사용하여 예측 정확도를 측정하여 최적의 성능을 낼 수 있는 컴퓨팅 리소스의 확장, 할당하는 기술
o 사업화 세부내용
- 기업 기계학습 모델 개발/운영을 위한 네이티브 클라우드 기반의 MLOps 환경 구축 제공함. 설치되는 인프라 환경의 사용 CPU/GPU Core수에 따라 영구라이센스 또는 월과금 형태로 과금하는 서비스 제공
- 주관기관/파트너 제휴기관인 아콘소프트와 인피노브는 제품 R&D에 집중하고 제품 판매 및 기술지원 활동은 파트너사 계약을 통해 확보된 파트너사 영업망을 통해 지원하여 주요 수요군을 선점하여 진출함.
- 고도화 단계에서는 IDC, IaaS 사업자와 제휴하여 글로벌 대상으로 서비스형(SaaS) 모델을 제공하여 인프라와 MLOps 개발/운영 환경을 월과금 형태로 서비스를 제공함.
◎ 1년차
● 목표
① 기계학습 데이터 저장 및 모델 개발 시스템 분석 설계
② 기계학습 모델 운영 관리 시스템 분석 설계
● 내용
- 데이터 저장 시스템 분석·설계
- 모델 개발 기능 분석·설계
- 모델의 훈련 및 평가, 유효성 검사 기능 분석·설계
- 모델 파이프라인 기능 분석·설계
- CD 모델 서빙 파이프라인의 분석·설계
- 버전 제어 프로그램의 분석·설계
- 모델 모니터링 프로그램의 분석·설계
- 컴퓨팅 리소스 모니터링 프로그램의 분석·설계
- 지속적 모니터링(CM, Continuous Monitoring) 프로그램의 분석·설계
- 구성요소 사이의 인터페이스를 위한 API 정의
◎ 2년차
● 목표
① 기계학습 데이터 저장 및 모델 개발 시스템 개발
② 기계학습 모델 운영 관리 시스템 개발
③ 개발 플랫폼의 통합 시제품 개발
● 내용
- 데이터 저장 시스템 개발
* 실시간 수집 데이터 및 대용량 배치 데이터를 저장할 수 있는 피처스토어 시스템 개발
- 모델 개발 기능 개발
* 모델 개발을 위한 프로세스를 지원하는 사용자 기능 개발
- 모델의 훈련 및 평가, 유효성 검사 기능 개발
- 모델 파이프라인 기능 개발
- 프로덕션 단계의 CD(모델 서빙) 프로그램의 개발
- 버전 제어 프로그램의 개발
- 엔드포인트 데이터 드리프트 & 예측 성능 모니터링 프로그램의 개발
- 컴퓨팅 리소스 모니터링 프로그램의 개발
- 지속적 모니터링(CM, Continuous Monitoring) 프로그램의 개발
- API 서비스 프로그램의 개발
- 화면 인터페이스 기획·개발
- 자동화된 기계학습 모델 개발 플랫폼과 기계학습 모델 운영 관리 시스템의 통합 패키지 개발
- 자동화된 기계학습 모델 개발 플랫폼과 기계학습 모델 운영 관리 시스템의 통합 테스트
◎ 3년차
● 목표
MLOps 솔루션의 서비스형 SaaS 제품 개발
● 내용
- 인터페이스 모듈의 분석·설계 및 개발
- 인증/인가 서비스 모듈의 분석·설계 및 개발
- 1단계 결과 솔루션(MARGARITA)의 멀티테넌트 어플리케이션으로 전환 분석·설계 및 개발
- 모니터링 수집 서브시스템 분석,설계 및 개발
- 모니터링 에이전트 서브시스템 분석,설계 및 개발
- 통합 모니터링 서브시스템 분석,설계 및 개발
- 로그분석 서비스 컴포넌트 분석,설계 및 개발
◎ 개방형혁신
- 컨설팅 목표 : 프로젝트를 성공적으로 추진하기 위해서는 (예비) 수요기업의 현장의 소리(애로사항, 기존 ML시스템을 사용하면서 문제점, ML시스템의 사용 용도 등)를 듣고 시스템 개발에 반영, 서비스형(SaaS) 제품의 개발 지원 및 사업화 마케팅
- 수행 단계
① 사업 PM과의 협의를 통한 타겟 고객(기업) 리스트업
② 파일럿 그룹 지정 및 의견 수렴
③ 개발 시스템의 통합 시제품 필드 테스트
④ 통합시제품 완성(필드 테스트 의견 반영)
⑤ 사업화 지원
- 수행 실적
KB증권, 신한은행 AI 통합센터, 신한카드 AI솔루션팀, 하이닉스, GS리테일, KB저축은행, 교보라이프플래닛, 다올저축은행, 하나카드 등 방문 협의 진행
※ 연구개발성과
ㅇ 정량적 성과
- 1, 2단계 결과물의 성능지표 달성 내용
- 성과지표 달성실적
* 특허(목표/실적) : 출원 5/7, 등록 2/1
* 신규인력채용(청년, 목표/실적) : 5/10
* SW 등록(목표/실적) : 5/4
* 매출실적(목표/실적) : 14.6/3.39(단위:억원)
* 기타 성과(목표/실적) : 과제 내용 관련 언론홍보 및 행사 참여 : 5/9
ㅇ 정성적 성과
[1차년도]
- 목표 시스템의 설계 부문
* 총 11개 개발 프로그램 영역에서 47개의 요구사항과 50개의 기능요건을 도출하여 설계함.
* 문서 산출물로 ‘요구사항정의서’, ‘기능정의서’, ‘아키텍처정의서’를 각 기관별로 작성함.(상세 내용은 설계 산출물 문서 참조)
[2차년도]
- 목표 시스템의 개발 부문
* 기계학습 데이터 저장 및 모델개발 시스템과 운영 관리 시스템의 개발 완료
* 개발 시스템의 통합시제품 개발 완료
[3차년도]
* MLOps 솔루션의 서비스형 SaaS 제품 개발 완료
※ 연구개발성과 활용계획 및 기대 효과
○ 활용계획
- 기술 고도화 부분
본 연구개발로 개발된 제품은 업계에서 통용되는 솔루션 관리에 기반한 사항을 적용하여 기술적인 고도화가 필요함. 세부적인 분류로는 구성 오픈소스 기술 최신화, 제품구조 고도화 및 제품 일반정책 구체화 및 절차 문서화가 해당될 수 있음.
* 구성 오픈소스 기술 최5신화
본 연구개발로 개발된 제품에는 공개된 오픈소스 기술이 적용된 부분이 존재함. 오픈소스 기술은 다수의 기여자를 통해 끊임없이 개선되고 최신화 되는 기술로, 결과 제품에 대한 최신 버전의 영향도를 분석, 적용하고 결과를 테스트하는 프로세스를 진행할 계획임.
* 제품구조 고도화
본 연구개발로 개발된 제품의 구조는 현장에 적용되면서 성능이 향상된 새로운 구조가 제안되거나 현장에서 확인할 수 있는 성능 관련 구조적인 개선 요구에 따라 고도화가 필요할 수 있음. 해당 사항에 대하여 개선할 수 있는 제품구조를 적용하고 테스트하여 진행하면 연구개발 성과의 완성도를 향상시킬 수 있음.
* 제품 일반정책 구체화 및 절차 문서화
본 연구개발로 개발된 제품을 업계 내에 통용되는 제품으로 제공하기 위해서는 현재까지 진행된 사항 이외로 제품에 대한 일반적인 정책을 구체화하고, 연관된 절차와 내용에 대하여 문서화할 필요가 있음. 이를 통하여 연구개발 제품의 완성도를 높이는데 기여할 수 있음.
- 사업화 부분
본 연구개발로 개발된 제품에 대한 사업화 부분의 활용은 기계학습 시스템을 요구하는 활용 분야를 구체화하고 대상을 상세화하여 세부적인 진행방안을 수립하는 것이 중요함. 활용 분야와 대상에 대하여 원활하게 적용하는 것을 목표로 진행할 계획임.
* 결과제품 활용분야
본 연구개발로 개발된 제품의 핵심 기능은 기계학습 시스템으로, 다양한 분야와 연계하여 활용할 수 있음.
활용 산업 분야 : 서비스, 제조, 금융, 보험, 의료, 헬스케어, 바이오, 자동차, 환경, 기후, 농수산업, 공공부문 연계 사용용도 : 영업 데이터 분석, 개인화 추천서비스, 사기, 부정행위 탐지, 학습 관리, 생산 관리, 자율주행, 의사결정, 자연어처리, 수율관리, 변화 예측 등
- 구체적인 활용 계획
* 기존 기계학습 시스템을 운영중인 대상
□ 현재시스템 컨설팅서비스 : 문제점 및 해결방안, 시스템 구조/프로세스 컨설팅
□ 컨설팅결과 POC : 컨설팅결과를 참고로한 결과제품으로 POC진행
□ 운영 시스템 적용 : 운영중 시스템에 대한 롤백 및 확대 구축
□ 기술지원 및 운영 관리 지원 서비스 제공
* 신규로 기계학습 시스템을 도입하려는 대상
□ 도입 시스템 적합성 진단 : 대상 요구사항에 따른 시스템 적합성 진단 및 검토
□ 시스템 도입 진행 : 결과제품의 설치 및 안정화 운영
□ 기술지원 및 운영 관리 지원 서비스 제공
○ 기대효과
□ 기술적 측면
○ 본 연구개발은 클라우드 네이티브 인프라 환경에서 설치·운영되는 기계학습 모델 개발 시스템과 프로덕션 모델의 운영 관리 시스템을 통합하여 그동안 비즈니스에서 기계학습 시스템을 구축, 활용하면서 안고 있었던 몇가지 문제점(① 종속성의 문제, ② 재현성의 문제, ③ 의사소통의 이슈, ④ 투명성 및 워크플로우 재사용성 부족의 문제)을 해소할 수 있음
□ 경제적·산업적 측면
○ 본 연구개발 제품을 사용하기 이전과 비교하여 조직에서는 불필요한 모델 학습 주기를 반복하지 않고, 실험 단계에서 데이터 과학자, ML엔지니어의 작업 시간 단축 효과를 가져와 유지비용의 절감과 효율적인 인적자원 활용으로 전체적으로는 이익을 증대시킬 수 있음
□사회적 측면
○ 본 연구개발 제품이 현장에 적용될 때 기계학습 시스템이 갖고 있는 모델 개발과정상의 복잡함과 종속성, 재현성 이슈 등을 해소할 수 있어서 그동안 이런 이유로 진입장벽이 있었던 기업(조직)들이 보다 더 쉽게 기계학습 방법을 적용한 프로젝트를 수행하게 된다면 이 분야의 신규 인력 채용이 증대될 것으로 예상됨
(출처 : 요약문 2p)
과제명(ProjectTitle) : | - |
---|---|
연구책임자(Manager) : | - |
과제기간(DetailSeriesProject) : | - |
총연구비 (DetailSeriesProject) : | - |
키워드(keyword) : | - |
과제수행기간(LeadAgency) : | - |
연구목표(Goal) : | - |
연구내용(Abstract) : | - |
기대효과(Effect) : | - |
Copyright KISTI. All Rights Reserved.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.