보고서 정보
주관연구기관 |
(주)웨어밸리 |
연구책임자 |
박덕수
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2017-05 |
과제시작연도 |
2016 |
주관부처 |
산업통상자원부 Ministry of Trade, Industry and Energy |
연구관리전문기관 |
한국산업기술평가관리원 Korea Evaluation Institute of Industrial Technology |
등록번호 |
TRKO201800040145 |
과제고유번호 |
1415145997 |
사업명 |
우수기술연구센터(ATC) |
DB 구축일자 |
2018-10-13
|
키워드 |
위/변조 방지.이중화.칼럼 암호화.PetaSQL.Column Stored DBMS.
|
초록
▼
□ 핵심기술
칼럼 저장 기반의 데이터 저장 플랫폼, PetaSQL은 他솔루션과의 경쟁력 강화를 위해 접근인증 및 제어, 데이터마스킹 및 암호화,데이터 위변조 방지 기능 및 기타 상업적인 판매에 필요한 기능이 추가된 최초의 한국형 데이터 저장 플랫폼
□ 최종목표
웨어밸리의 최종 목표는 국내 최초의 1 Petabyte급의 한국형 데이터 저장 플랫폼을 구현하여 국내 중·소규모의 기업에서 저비용 고사용의 국산 DBMS를 손쉽게 도입하여 운영 할 수 있도록 공급하는데 있다.
□ 개발내용 및 결과
가.
□ 핵심기술
칼럼 저장 기반의 데이터 저장 플랫폼, PetaSQL은 他솔루션과의 경쟁력 강화를 위해 접근인증 및 제어, 데이터마스킹 및 암호화,데이터 위변조 방지 기능 및 기타 상업적인 판매에 필요한 기능이 추가된 최초의 한국형 데이터 저장 플랫폼
□ 최종목표
웨어밸리의 최종 목표는 국내 최초의 1 Petabyte급의 한국형 데이터 저장 플랫폼을 구현하여 국내 중·소규모의 기업에서 저비용 고사용의 국산 DBMS를 손쉽게 도입하여 운영 할 수 있도록 공급하는데 있다.
□ 개발내용 및 결과
가. 개발내용
Column 저장 기반의 PetaSQL 설계 및 구현: 오픈 소스인 MonetDB 기반의 데이터 저장 플랫폼으로서 중·소규모의 데이터 로그 저장부터 중·대형 규모의 빅데이터 저장 및 분석까지범용 적으로 운영 가능한 데이터 저장 플랫폼
1) MonetDB의 기본 JDBC 및 ODBC (3.0으로 업그레이드) 개선 및 버그 수정
2) 他DBMS와의 경쟁력 강화를 위한 신규 기능 추가 구현
① DB 복제를 활용한 이중화 기능 추가 설계 및 구현
② 파티션 테이블 설계 및 구현
③ 데이터베이스 링크 설계 및 구현
④ 바이너리 백업 및 복구 설계 및 구현
⑤ 복합인덱스 설계 및 구현
⑥ 테이블 락 및 카탈로그 뷰 구현
⑦ 샤딩 설계 (ATC 사업 종료 후 계속 개발 중)
3) 중·소 솔루션 프로젝트 Embedding 목적으로서의 경쟁력 강화 기능 구현 및 지원
① 칼럼 단위의 암호화 지원
② 데이터 위변조 방지 지원
③ 정보 유출 통제 지원
④ Application 개발 Platform 제공
⑤ PetaSQL 관리 및 개발도구 구현 (Orange for PetaSQL)
나. 개발 결과
(1) PetaSQL로의 로그 저장 플랫폼 변경
ATC 사업 중 웨어밸리의 1단계(2013.06 ~ 2015.05) 개발 목표는 웨어밸리의 주력 제품인 데이터베이스 접근제어 솔루션 샤크라 맥스의 로그 저장 DBMS를 MySQL에서 PetaSQL로의 변경이였다.
기존 기능의 개선과 기타 부가 기능의 신규 개발을 통하여 기존 에 사용하던 데이터 저장소를 MySQL에서 PetaSQL로 변경하여 운영한 결과 ;
① 감사로그 저장 성능 개선 효과
=> 25,000/sec => 60,000/sec 저장
② 감사로그 검색 및 통계 리포트 작성 성능 개선
=> 10배의 성능 향상
또한 당사 제품에만 적용하는 게 아닌 차후 새로운 DBMS 시장진출을 위하여 중·소규모의 프로젝트에도 활용 가능 하도록 Embedding 할 수 있는 기능을 추가 하였다. 이 결과;
① 권한 없는 사용자에게 Read-Only Table 속성을 부여하여 데이터 위/변조 방지가 가능 하며,
② 기본적인 계정 관리를 포함하여 인증된 프로세스만 접근을 허용하고 데이터 접근 및 입출력 행위 기록 및 통제할 수 있도록 PetaSQL 접근 인증 및 제어 기능 추가
③ 기밀정보 설정 및 인가/비인가 사용자에게 특정 칼럼 데이터를 Masking (****) 또는 암호화하여 전송하는 데이터 기능을 추가 하였다.
웨어밸리의 2단계(2015.06 ~ 2017.05) 개발 목표는 이중화 구성을 통한 ‘감사 로그 유실 방지’ 와 ‘업무 연속성 보장’ 및‘GS 인증’을 통한 버그 수정 및 실질적인 상품화 준비였다.
Chakra Max 엔진 및 로그 데이터 이중화 기능 지원을 통하여;
① PetaSQL Replication 적용으로 “감사 로그 유실 방지”
② 엔진 이중화 및 PetaSQL 이중화를 통한 “업무 연속성 보장”
③ 자체 개발 DBMS 탑재를 통한 원가 절감 효과
=> MySQL의 경우 약 1천만 원의 다른 기업 솔루션 구매비 발생
=> 년간 15% (150만원)의 유지 보수비용 발생
=> 50개 고객사 이중화 지원시 약 575,000,000원 비용 절감
(2) 주요 수상 및 인증
웨어밸리의 PetaSQL은 지속적인 기술 개발 및 기능 개발이 필요로 하지만 2017년 1월을 기준으로;
① “2017 2주차 IR52 장영실상”을 수상 하였으며
② “2017년 06월 17일 Good Software 1등급” 인증을 획득하였다.
ATC 사업 과정을 통하여 웨어밸리는 연구개발목표에 맞게 1Petabyte 급의 한국 형 Data Warehouse의 기초가 되는 칼럼 기반의 데이터 저장 플랫폼을 구현하였으며, 사업화 계획에 따라당사 데이터 보안 솔루션인 샤크라 맥스에 Repository DBMS로서 Embedding 하여 국내 기업 및 일본 기업에 판매하였다. 또한 PetaSQL의 개발 및 운영에 필요한 도구로서 당사의 데이터 베이스 개발 및 관리도구인 Orange제품을 기반으로 Orange for PetaSQL을 추가 구현하여 범용 적으로 사용가능하도록 추가 개발 하였다. PetaSQL의 개발로 통하여 웨어밸리는 국내 IT 기업최초로 2회 연속 장영실상을 수상하였으며, 지난 6월 획득한 GS 인증을 통하여 제품에 대한 성능 평가 및 시장에 공급 가능한 제품으로서의 평가도 마무리 하였다.
웨어밸리는 지속적인 연구 투자 및 추가 기능 개발을 통하여 PetaSQL의 시장 보급에 충실할 예정이며, 2017년 하반기 웨어밸리의 제품 라인업의 하나로서 공식적인 시장 공개를 준비하고 있다.
□ 기술개발 배경
데이터 저장 플랫폼 시장에서 Row 방식의 장점은 Record를 쉽게 추가하고 수정할 수 있다는 것이고, 반면에 단점은 불필요한 데이터까지 읽으므로 많은 시간이 소요 된다는 것이다. 그러나 칼럼 방식은 필요한 데이터만 읽음으로서 시간을 단축시켜 고객이 데이터의 분석함에 있어 아주 적합하다는 것이다. 또한 칼럼 방식의 저장소는 디스크에서 추출하는 데이터양을 줄임으로써, DISK의 사용 공간을 감소시키고 디스크 입출력을 최소화하고 병목현상을 방지하여 검색 속도를 대폭 향상시킴으로서 Row 기반의 데이터 저장 플랫폼보다 효과적인 운영 시간을 제공한다.
년 평균 250 ~ 300개의 DB 접근제어 솔루션 샤크라 맥스를 시장에 공급하는 웨어밸리는 로그 저장 DBMS로서 MySQL을 사용하였으나, 고객사의 장기간 제품 사용 및 트랜잭션 증가에 따른 로그 데이터양의 증가, 증가한 로그 데이터양에 따른 분석시간의 증가, 저장하여 보관해야 하는 데이터양의 증가에 따라 DB 증설이 필요하고, 또한 이중화에 따른 추가 비용의 증가로 인한 다양한 문제점 때문에 새로운 데이터 저장 플랫폼을 요구받게 되었다. 즉,
- 데이터가 차지하는 저장 공간을 줄여, 추가적인 확장을 보완해야 했으며,
- 검색속도를 높임으로써, 사용자의 노동 시간 단축 및 편의성을 증대시켜야 했으며,
- 마지막으로 他 솔루션 구매를 방지하여 도입 비용 및 유지보수 비용 감소를 통하여 시장 경쟁력을 높일 필요가 있어 새로운 DBMS 개발을 추진하게 되었다.
또한 이중화 지원에 따른 他솔루션 구입비용의 문제점, 클 라우듯, 빅데이터와 같은 새로운 개념의 사업형태의 등장으로 인한 대용량 데이터 분석의 필요성 등도 당사가 직·간접적으로 새로운 DBMS 도입 및 개발에 필요한 배경 이였다.
□ 핵심개발 기술의 의의
가. 오픈 소스를 활용한 국내 최초의 칼럼 기반의 DBMS
- 이 번 ATC 사업을 통하여 개발한 PetaSQL의 근간은 네덜란 듯 연구소에서 시작한 칼럼 기반의 MonetDB이다.
- 국내에서 판매되는 국산 DBMS의 경우 자체 개발을 통해 최소 10여년 이상의 연구 개발 기간 및 많은 인력이 투입되었으나, 웨어밸리는 오픈소스를 활용하였기 때문에 상대적으로 4년 이란 시간이 소요 되었으며, 자체 TFT팀을 통하여 성공적으로 개발 완료 하였다.
- 또한 최초 1단계 사업에서는 범용적인 DBMS 개발 보다는 자사 솔루션 및 他社 솔루션에 쉽게 적용될 수 있도록 사용 범위를 최소화 하였다.
나. 개선 작업 및 신규 기능 개발 추가
- 비록 오픈 소스에 기반을 둔 제품이지만 당사 제품에 탑재하여 상업용으로 사용하기에는 많은 문제점이 있었으며, 이를 개선하기 위하여 4개월의 초기 개선 기간에 많은 업무 집중이 있었으며,
- 당사 제품 Chakra Max와의 호환성 최적화 및 일반 시장 보급을 위한 신규 기능; DB링크, 암호화, 이중화, 등 많은 새로운 기능이 추가 개발 되었다.
다. 개발 난이도
- 웨어밸리는 2001년 설립 시작부터 데이터베이스와 관련된 솔루션 및 도구를 개발하고 판매하여 MonetDB의 기본구조 및 분석, 그리고 DBMS의 신규 기능의 필요성 분석에는 많은 어려움은 없었으나, 결국 가장 많은 시간이 투자된 부분은 안정화 부분이라고 할 수 있다. 일반적인 솔루션과 달리 DBMS의 경우 기업의 민감한 정보 및 기업의 중요 자산이 쌓여서 보관되는 장소이다. 한 번의 실수로 인하여 중요자산이 분실 또는 훼손이 될 수 있는 부분이기에, 이 부분에 있어 새로운 제품도입 및 적용은 당사에서도 고객입장에서도 모두 쉽지 않은 부분 이였을 것이다. 즉, 실질적인 개발에 필요한 난이도는 높지 않다 할 수 있지만, 그것을 검증하고 실 환경에서의 테스트 및 실 적용이 가장 난해한 부분이라고 말할 수 있다. 하지만 웨어밸리는 시장 공개에 앞서 ATC 개발 기간 내내 샤크라 맥스를 도입하여 운영중인 기존 고객사를 충분히 활용하여 제품의 안정도를 높였으며, 또한 2017년 상반기 GS 인증을 통하여 고객의 새로운 DBMS 사용에 대한 불안감을 최소화 하였다.
라. 국산화 정도
- 웨어밸리에서 개발 완료한 칼럼 기반의 DBMS는 MonetDB를 근간으로 개발되었지만, 기존의 MonetDB에서 가지지 못한 많은 기능을 새로이 추가 하였으며, 기존 기능 또한 많은 고객사를 통한 제품 테스트 과정동안 개선되었다.
마. 해외기술 도입을 통한 개발 여부
- 해당 사항 없음
- 모든 신규 기능은 웨어밸리 연구소에서 자체 구현
바. 기술수출 가능성
- PetaSQL의 수출을 위하여 웨어밸리에서는 현재 상해에 설립된 현지 합작 법인을 통하여 소개되고 있으나, 제품 개발 기간 5년차로 실제 기술 수출까지는 아직 부족함
□ 적용분야
가. Embedding으로서의 활용
Embedding은 응용 프로그램에 내장되어 사용자 입장에서는 DBMS의 존재가 보이지 않는 것처럼 동작하는 것으로 별도의 데이터베이스 설정이나, 데이터베이스 관리가 개입되지 않는 것이 특징 (현재 Chakra Max 적용, 500여개 이상의 고객사에서 사용 중)
- BI, ERP, 보안 솔루션, 모니터링 솔루션 등 다양한 프로젝트 사업 및 중·소규모의 시스템 도입 사업에 저장소 역할 가능
나. Data Warehouse
- 통합 데이터 분석 솔루션으로서의 Data Warehouse
- CRM/e-CRM을 위한 빅데이터 고객 정보에 적용 가능
- 통합 고객 DB를 통한 운영영역이 일괄된 고객 데이터 제공필요 시 PetaSQL 적용 가능
다. 컬럼 방식의 데이터 저장소 시장 요약
- 컬럼 방식의 데이터 저장소는 2000년대 중반 미국 예일대학,MIT 등에서 개발하여, 최근 글로벌 대형 기업에서 데이터웨어하우스 구축을 위해 활용되고 있음. 최근 발표된 가트너 분석 보고서에서는 칼럼 방식의 데이터 저장소가 안정기에 접어들었으며, 지속적으로 성장할 것으로 예측하였음.
- 빅데이터 환경에서 서비스 및 분석 문제를 해결하기 위하여 하둡 (Hadoop)이나 NoSQL기반의 분산 데이터 처리기술이 등장하고 있으나, 호환성이 부족하여 중소기업용 서비스 적용에는 한계가 있음. 칼럼 저장소 기술은 이미 안정기에 접어든 반면, NoSQL의 경우 아직 기술 발생기에 있으며, 주류(Mainstream)에 편입되기까지는 앞으로 5년은 추가로 필요할 것으로 예상함.
( 출처 : 최종보고서초록 - 3. 개발결과 요약 6p )
목차 Contents
- 표지 ... 1
- 기술개발사업 최종보고서 초록 ... 2
- 기술개발사업 주요 연구성과 ... 22
- 목차 ... 25
- 제 1 장 서론 ... 26
- 제 1 절 과제의 개요 ... 26
- 제 2 장 과제 수행의 내용 및 결과(기술개발 내용 및 방법) ... 29
- 제 1 절 최종 목표 및 평가 방법 ... 29
- 제 2 절 단계 목표 및 평가 방법 ... 32
- 제 3 절 연차별 개발 내용 및 개발 범위 ... 42
- 1. 1차년도 개발 내용 및 개발 범위 ... 42
- 2. 2차년도 (1단계) 개발 내용 및 개발 범위 ... 66
- 3. 3차년도 (2단계) 개발 내용 및 개발 범위 ... 118
- 3. 4차년도 (2단계) 개발 내용 및 개발 범위 ... 140
- 제 4 절 수행 결과의 보안등급 ... 150
- 제 5 절 유형적 발생품(연구시설, 연구장비 등) 구입 및 관리 현황 ... 151
- 제3장 결과 및 사업화 계획 ... 152
- 제1절 연구개발 최종 결과 ... 152
- 1. 1차년도 연구 개발 추진 일정 및 실적 ... 152
- 2. 2차년도 연구 개발 추진 일정 및 실적 ... 153
- 3. 3차년도 연구 개발 추진 일정 및 실적 ... 154
- 4. 4차년도 연구 개발 추진 일정 및 실적 ... 155
- 5. 기술 개발 결과의 유형 및 무형 성과 (1) ... 156
- 6. 기술 개발 결과의 유형 및 무형 성과 (2) ... 157
- 제2절 연구개발 추진 체계 ... 158
- 제3절 시장 현황 및 사업화 전망 ... 162
- 제 4절 고용 창출 효과 ... 175
- 제5절 자체보안관리진단표 ... 176
- 끝페이지 ... 176
※ AI-Helper는 부적절한 답변을 할 수 있습니다.