[논문]PDTnet XML Schema 데이터를 위한 저장 기법 개발

이경혜; 용환승; 이월영

PDTnet XML Schema 데이터를 위한 저장 기법 개발
Development of Storage Techniques for PDTnet XML Schema Data 원문보기

멀티미디어학회논문지 = Journal of Korea Multimedia Society, v.9 no.8, 2006년, pp.939 - 949

이경혜 (삼성전자) , 용환승 (이화여자대학교 공과대학 컴퓨터학과) , 이월영 (서울기독대학교 국제경영정보학과)

초록
AI-Helper

오늘날 산업의 발전에 따라 제품의 개발에서 생산 및 판매에 이르기까지의 모든 과정을 컴퓨터를 통해 일원적으로 관리할 수 있는 환경을 구축하는 것이 중요해지고 있다. 특히 PDTnet XML 스키마는 PDM(Product Data Management) 데이터를 교환하기 위한 국제 표준으로써, 이 스키마에 따라 작성된 XML 데이터를 효율적으로 처리하는 것이 필수적이다. 그러나 PDTnet XML 스키마는 기존의 XML 스키마와는 달리 IDREF/IDREFS 속성이 비정규적이기 때문에 이를 효율적으로 다루기 위해서는 어떠한 저장장치에 어떠한 방식으로 저장하느냐가 중용한 요인이라고 할 수 있다. 우리는 안정성 있는 성능을 보장 받고 있어 널리 사용되고 있는 관계형 데이터베이스를 이용하여, PDTnet XML스키마의 고유 속성을 살려 다양한 타입의 질의를 지원할 수 있는 저장 기법을 개발하였다. 본 논문에서 개발하고 구현한 저장 기법을 PDTnet XML 스키마를 따르는 데이터 외에도, 구조가 불규칙적이거나, 참조 속성을 이용하여 데이터 중복을 최소화 시킬 필요가 있는 XML 데이터를 다루는 모든 응용에 적용되어 효율적인 데이터 관리를 가능케 할 수 있을 것으로 기대된다.

Abstract ▼ AI-Helper

With the development of industry, product data management system is becoming more and more important. An expanded view of product definition function that include a bill of material and routing database, current and historical engineering data and specifications and engineering changes order history. PDM (Product Data Management) systems hold and manage such material as product specifications, plans, geometric models, CAD drawings and images. Furthermore, PDM enables companies producing complex products to spread product data in to the entire launch process. Especially, PDTnet XML Schema is an international standard for exchanging of PDM data. But PDTnet XML Schema differs from existing XML Schema in the way that its property of IDREF/IDREFS is irregular. Therefore it is important factor that. what do we use storage devices and storage techniques. We developed storage techniques and application supporting various query types and preserving PDTnet XML Schema using a relational database that guaranteeing the performance nowadays. In this paper, we will show that our storage techniques minimize repeated data and optimize query processing by using application comparison with storage techniques of existing XML Schema data.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 논문에서는 PDTnet XML schema 데이터의 저장을 위하여 테이블 조각화 현상을 최소화하는 저장 기법을 개발하고 저장된 데이터를 효과적으로 질의 처리할 수 있는 응용 프로그램을 개발하였다.
그러나 관계형 데이터베이스는 가장 보편화 되어 있는 저장 모델이고 저렴한 비용으로 웹 환경의 애플리케이션들을 쉽게 통합할 수 있도록 해주며, XML 문서를 구조화하여 관리할 수 있다는 장점을 지니고 있기 때문에 다른 저장 모델을 사용하여 XML schema 데이터를 관리하는 것보다 유리하다고 할 수 있다. 본 논문에서는 비정규적인 구조의 PDM 데이터를 관계형 데이터베이스를 이용하여 저장하되 테이블의 조각화 현상이나 데이터 중복을 최소화하여 검색할 때 조인의 횟수를 줄일 수 있도록 하였다. 또한 저장된 데이터를 빠르게 검색할 수 있는 응용 프로그램을 개발하였다.
또한 질의 처리기를 통하여 가져온 데이터를 XML 문서로 자동 변환 할 수도 있다. 본 논문에서는 우리가 구현한 PDTnet Query handler를 통해 질의 비용을 측정하였다.
우리는 본 논문에서 PDTnet XML Schema의 특징을 잘 고려하여 이를 관계형 데이터베이스에 저장하는 두 가지 기법을 제안하였다. 또한 전용 질의 처리기를 개발함으로써, 데이터를 효율적으로 검색할 수 있으며 질의도 편리하게 할 수 있도록 하였다.

제안 방법

본 논문에서는 데이터베이스에 저장된 문서 형태에 따른 데이터베이스 크기와 질의 시간을 평가 기준으로 삼았다. XML document의 크기, 각 매핑 스키마의 데이터 크기와 인덱스 크기를 모두 측정하였으며, 데이터베이스 크기는 unbounded 속 성의 엘리먼트의 발생 횟수를 1회, 6회, 12회, 18회, 24회로 증가시키면서 측정하였다.
각 저장 기법을 비교하고 성능평가를 하기 위하여, PDTnet XML Schema 중 item 엘리먼트와 연관된 일부 엘리먼트들로 간단한 xsd 파일과 xml 예제 파일을 만들었다.
본 논문에서는 비정규적인 구조의 PDM 데이터를 관계형 데이터베이스를 이용하여 저장하되 테이블의 조각화 현상이나 데이터 중복을 최소화하여 검색할 때 조인의 횟수를 줄일 수 있도록 하였다. 또한 저장된 데이터를 빠르게 검색할 수 있는 응용 프로그램을 개발하였다.
최적의 저장 기법을 결정하는 것은 저장된 데이터를 얼마나 효율적으로 관리할 수 있는가에 따라 평가될 수 있다. 본 논문에서는 데이터베이스에 저장된 문서 형태에 따른 데이터베이스 크기와 질의 시간을 평가 기준으로 삼았다. XML document의 크기, 각 매핑 스키마의 데이터 크기와 인덱스 크기를 모두 측정하였으며, 데이터베이스 크기는 unbounded 속 성의 엘리먼트의 발생 횟수를 1회, 6회, 12회, 18회, 24회로 증가시키면서 측정하였다.
본 논문에서는 위의 질의유형에 대해 예제 질의를 적용하여 성능평가를 수행하였다. 단위 시간은 ms이며, 모두 5회에 걸친 결과 값의 평균을 기록하였다.
String-Inlining 기법은 IDREF/IDREFS의 참조 데이터를 부모 테이블에 그대로 저장하는 반면, XML-DBMS 기법은 기존의 다른 기법들과 마찬가지로 다른 테이블에 분리하여 저장한다. 이에 본 성 능 평가에서는 IDREF/IDREFS 속성 이 한 종류의 엘 리 먼트만을 참조할 때, 참조되는 엘리먼트의 수가 증가함에 따라, XML-DBMS 기법과 String-Inlining 기법의 질의 처리 속도가 어떻게 변하는지를 비교하였다.

성능/효과

'단일 발생 횟수의 엘리먼트에 대한 질의 비용'에서 삽입과 조인 질의에 String-Inlining 기법이 Key- Join 기법보다 더 나은 성능을 보였다. 그러나 실제 PDM 데이터는 집합 값 애 트리 뷰트나 반복되는 엘리먼트들, 참조하는 엘리먼트가 다수개인 IDREF7 IDREFS가 발생될 경우가 많기 때문에 이들의 발생 횟수에 따른 성능을 측정할 필요가 있다.
Key-Join 기법과 String-Inlining 기법은 모두데 이터베이스 크기의 최소화를 고려하여 설계한 것이므로 예측대로 두 schema의 기본 데이터에 대한 저장 크기는 거의 차이가 없었다. 다만 인덱스의 크기는 Key-Join 기법의 외래키(Foreign key) 컬럼에 검색속도의 향상을 위하여 인덱스를 생성하였기 때문에 String-Inlining 기법에 비해 두 배에 가까운 크기를 보이고 있다.
item의 id 값을 통해 item 테이블만의 내용을 가져오는 시간과 해당 id에 대해 item의 하위 엘리먼트들까지 모두 가져오는 시간을 측정해본 결과 Key-Join 기법이 15% 정도 더 나은 성능을 보였다. 이는 String-Inlining 기법이 읽어 들인 부분의 데이터를 분석하여 그 하위 엘리먼트를 읽는 질의를 생성해나 가는 방식이기 때문에 Key-Join 기법보다 높은 질의 횟수를 가지기 때문이다.
우리는 본 논문에서 PDTnet XML Schema의 특징을 잘 고려하여 이를 관계형 데이터베이스에 저장하는 두 가지 기법을 제안하였다. 또한 전용 질의 처리기를 개발함으로써, 데이터를 효율적으로 검색할 수 있으며 질의도 편리하게 할 수 있도록 하였다. 우리의 저장 기법은 PDTnet XML Schema의 불규칙적이고 반복적인 구조를 처리하는데 있어, 기존의 저장 기법들에 비해 데이터의 반복을 최소화했을 뿐 아니근}, 질의 시에 조인으로 처리하는 기존의 방식에 비해 훨씬 더 효율적이기 때문에 질의 속도를 향상 시 킬 수 있도록 하였다.
여섯 개의 질의 유형에 대한 Key-Join 기법과 String-Mining 기법의 질의 시간을 비교해보면, 전 반적으로 비슷하나, 삽입 와 조인 시에 String- Inlining 기법이 더 좋은 성능을 보임을 알 수 있다. Key-Join 기법에서는 외래키(Foreign key)가 있어서 삽입 시 참조 무결성을 체크하는 시간이 걸리므로 String-Inlining 기법보다는 느린 질의 시간을 보인다.
위의 결과에서 알 수 있듯, String-Inlining 기법이 XML-DBMS 기법보다 항상 더 빠른 질의 시간을 보이고 있으며, 참조 엘리먼트 종류의 수가 증가할수록 차이는 더 커진다.
참조되는 엘리먼트의 수를 1개에서 100개까지 증가 시키면서 질의 처리 속도를 측정해본 결과, 참조 엘리먼트의 수가 증가할수록 String-Inlining 기법이 XML-DBMS 기법보다 훨씬 빠른 것으로 나타났다. 이는 XML-DBMS 기법이 참조 속성의 데이터를 다른 릴레이션에 분리하여 저장하기 때문에, 부모 테 이블과 참조 속성 테이블의 조인이 참조 엘리먼트의 개수만큼 추가되어 일어나기 때문이다.

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

PDTnet XML Schema 데이터를 위한 저장 기법 개발
Development of Storage Techniques for PDTnet XML Schema Data 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

성능/효과

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

PDTnet XML Schema 데이터를 위한 저장 기법 개발 Development of Storage Techniques for PDTnet XML Schema Data 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

성능/효과

이 논문을 인용한 문헌

저자의 다른 논문 :

용환승 (51)

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

PDTnet XML Schema 데이터를 위한 저장 기법 개발
Development of Storage Techniques for PDTnet XML Schema Data 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper