오늘날 산업의 발전에 따라 제품의 개발에서 생산 및 판매에 이르기까지의 모든 과정을 컴퓨터를 통해 일원적으로 관리할 수 있는 환경을 구축하는 것이 중요해지고 있다. 특히 PDTnet XML스키마는 PDM(Product Data Management) 데이터를 교환하기 위한 국제 표준으로써, 이 스키마에 따라 작성된 XML 데이터를 효율적으로 처리하는 것이 필수적이다. 그러나 PDTnet XML 스키마는 기존의 XML 스키마와는 달리 IDREF/IDREFS 속성이 비정규적이기 때문에 이를 효율적으로 다루기 위해서는 어떠한 저장장치에 어떠한 방식으로 저장하느냐가 중용한 요인이라고 할 수 있다. 우리는 안정성 있는 성능을 보장 받고 있어 널리 사용되고 있는 관계형 데이터베이스를 이용하여, PDTnet XML스키마의 고유 속성을 살려 다양한 타입의 질의를 지원할 수 있는 저장 기법을 개발하였다. 본 논문에서 개발하고 구현한 저장 기법을 PDTnet XML 스키마를 따르는 데이터 외에도, 구조가 불규칙적이거나, 참조 속성을 이용하여 데이터 중복을 최소화 시킬 필요가 있는 XML 데이터를 다루는 모든 응용에 적용되어 효율적인 데이터 관리를 가능케 할 수 있을 것으로 기대된다.
오늘날 산업의 발전에 따라 제품의 개발에서 생산 및 판매에 이르기까지의 모든 과정을 컴퓨터를 통해 일원적으로 관리할 수 있는 환경을 구축하는 것이 중요해지고 있다. 특히 PDTnet XML 스키마는 PDM(Product Data Management) 데이터를 교환하기 위한 국제 표준으로써, 이 스키마에 따라 작성된 XML 데이터를 효율적으로 처리하는 것이 필수적이다. 그러나 PDTnet XML 스키마는 기존의 XML 스키마와는 달리 IDREF/IDREFS 속성이 비정규적이기 때문에 이를 효율적으로 다루기 위해서는 어떠한 저장장치에 어떠한 방식으로 저장하느냐가 중용한 요인이라고 할 수 있다. 우리는 안정성 있는 성능을 보장 받고 있어 널리 사용되고 있는 관계형 데이터베이스를 이용하여, PDTnet XML스키마의 고유 속성을 살려 다양한 타입의 질의를 지원할 수 있는 저장 기법을 개발하였다. 본 논문에서 개발하고 구현한 저장 기법을 PDTnet XML 스키마를 따르는 데이터 외에도, 구조가 불규칙적이거나, 참조 속성을 이용하여 데이터 중복을 최소화 시킬 필요가 있는 XML 데이터를 다루는 모든 응용에 적용되어 효율적인 데이터 관리를 가능케 할 수 있을 것으로 기대된다.
With the development of industry, product data management system is becoming more and more important. An expanded view of product definition function that include a bill of material and routing database, current and historical engineering data and specifications and engineering changes order history...
With the development of industry, product data management system is becoming more and more important. An expanded view of product definition function that include a bill of material and routing database, current and historical engineering data and specifications and engineering changes order history. PDM (Product Data Management) systems hold and manage such material as product specifications, plans, geometric models, CAD drawings and images. Furthermore, PDM enables companies producing complex products to spread product data in to the entire launch process. Especially, PDTnet XML Schema is an international standard for exchanging of PDM data. But PDTnet XML Schema differs from existing XML Schema in the way that its property of IDREF/IDREFS is irregular. Therefore it is important factor that. what do we use storage devices and storage techniques. We developed storage techniques and application supporting various query types and preserving PDTnet XML Schema using a relational database that guaranteeing the performance nowadays. In this paper, we will show that our storage techniques minimize repeated data and optimize query processing by using application comparison with storage techniques of existing XML Schema data.
With the development of industry, product data management system is becoming more and more important. An expanded view of product definition function that include a bill of material and routing database, current and historical engineering data and specifications and engineering changes order history. PDM (Product Data Management) systems hold and manage such material as product specifications, plans, geometric models, CAD drawings and images. Furthermore, PDM enables companies producing complex products to spread product data in to the entire launch process. Especially, PDTnet XML Schema is an international standard for exchanging of PDM data. But PDTnet XML Schema differs from existing XML Schema in the way that its property of IDREF/IDREFS is irregular. Therefore it is important factor that. what do we use storage devices and storage techniques. We developed storage techniques and application supporting various query types and preserving PDTnet XML Schema using a relational database that guaranteeing the performance nowadays. In this paper, we will show that our storage techniques minimize repeated data and optimize query processing by using application comparison with storage techniques of existing XML Schema data.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 PDTnet XML schema 데이터의 저장을 위하여 테이블 조각화 현상을 최소화하는 저장 기법을 개발하고 저장된 데이터를 효과적으로 질의 처리할 수 있는 응용 프로그램을 개발하였다.
그러나 관계형 데이터베이스는 가장 보편화 되어 있는 저장 모델이고 저렴한 비용으로 웹 환경의 애플리케이션들을 쉽게 통합할 수 있도록 해주며, XML 문서를 구조화하여 관리할 수 있다는 장점을 지니고 있기 때문에 다른 저장 모델을 사용하여 XML schema 데이터를 관리하는 것보다 유리하다고 할 수 있다. 본 논문에서는 비정규적인 구조의 PDM 데이터를 관계형 데이터베이스를 이용하여 저장하되 테이블의 조각화 현상이나 데이터 중복을 최소화하여 검색할 때 조인의 횟수를 줄일 수 있도록 하였다. 또한 저장된 데이터를 빠르게 검색할 수 있는 응용 프로그램을 개발하였다.
또한 질의 처리기를 통하여 가져온 데이터를 XML 문서로 자동 변환 할 수도 있다. 본 논문에서는 우리가 구현한 PDTnet Query handler를 통해 질의 비용을 측정하였다.
우리는 본 논문에서 PDTnet XML Schema의 특징을 잘 고려하여 이를 관계형 데이터베이스에 저장하는 두 가지 기법을 제안하였다. 또한 전용 질의 처리기를 개발함으로써, 데이터를 효율적으로 검색할 수 있으며 질의도 편리하게 할 수 있도록 하였다.
제안 방법
본 논문에서는 데이터베이스에 저장된 문서 형태에 따른 데이터베이스 크기와 질의 시간을 평가 기준으로 삼았다. XML document의 크기, 각 매핑 스키마의 데이터 크기와 인덱스 크기를 모두 측정하였으며, 데이터베이스 크기는 unbounded 속 성의 엘리먼트의 발생 횟수를 1회, 6회, 12회, 18회, 24회로 증가시키면서 측정하였다.
각 저장 기법을 비교하고 성능평가를 하기 위하여, PDTnet XML Schema 중 item 엘리먼트와 연관된 일부 엘리먼트들로 간단한 xsd 파일과 xml 예제 파일을 만들었다.
본 논문에서는 비정규적인 구조의 PDM 데이터를 관계형 데이터베이스를 이용하여 저장하되 테이블의 조각화 현상이나 데이터 중복을 최소화하여 검색할 때 조인의 횟수를 줄일 수 있도록 하였다. 또한 저장된 데이터를 빠르게 검색할 수 있는 응용 프로그램을 개발하였다.
최적의 저장 기법을 결정하는 것은 저장된 데이터를 얼마나 효율적으로 관리할 수 있는가에 따라 평가될 수 있다. 본 논문에서는 데이터베이스에 저장된 문서 형태에 따른 데이터베이스 크기와 질의 시간을 평가 기준으로 삼았다. XML document의 크기, 각 매핑 스키마의 데이터 크기와 인덱스 크기를 모두 측정하였으며, 데이터베이스 크기는 unbounded 속 성의 엘리먼트의 발생 횟수를 1회, 6회, 12회, 18회, 24회로 증가시키면서 측정하였다.
본 논문에서는 위의 질의유형에 대해 예제 질의를 적용하여 성능평가를 수행하였다. 단위 시간은 ms이며, 모두 5회에 걸친 결과 값의 평균을 기록하였다.
String-Inlining 기법은 IDREF/IDREFS의 참조 데이터를 부모 테이블에 그대로 저장하는 반면, XML-DBMS 기법은 기존의 다른 기법들과 마찬가지로 다른 테이블에 분리하여 저장한다. 이에 본 성 능 평가에서는 IDREF/IDREFS 속성 이 한 종류의 엘 리 먼트만을 참조할 때, 참조되는 엘리먼트의 수가 증가함에 따라, XML-DBMS 기법과 String-Inlining 기법의 질의 처리 속도가 어떻게 변하는지를 비교하였다.
성능/효과
'단일 발생 횟수의 엘리먼트에 대한 질의 비용'에서 삽입과 조인 질의에 String-Inlining 기법이 Key- Join 기법보다 더 나은 성능을 보였다. 그러나 실제 PDM 데이터는 집합 값 애 트리 뷰트나 반복되는 엘리먼트들, 참조하는 엘리먼트가 다수개인 IDREF7 IDREFS가 발생될 경우가 많기 때문에 이들의 발생 횟수에 따른 성능을 측정할 필요가 있다.
Key-Join 기법과 String-Inlining 기법은 모두데 이터베이스 크기의 최소화를 고려하여 설계한 것이므로 예측대로 두 schema의 기본 데이터에 대한 저장 크기는 거의 차이가 없었다. 다만 인덱스의 크기는 Key-Join 기법의 외래키(Foreign key) 컬럼에 검색속도의 향상을 위하여 인덱스를 생성하였기 때문에 String-Inlining 기법에 비해 두 배에 가까운 크기를 보이고 있다.
item의 id 값을 통해 item 테이블만의 내용을 가져오는 시간과 해당 id에 대해 item의 하위 엘리먼트들까지 모두 가져오는 시간을 측정해본 결과 Key-Join 기법이 15% 정도 더 나은 성능을 보였다. 이는 String-Inlining 기법이 읽어 들인 부분의 데이터를 분석하여 그 하위 엘리먼트를 읽는 질의를 생성해나 가는 방식이기 때문에 Key-Join 기법보다 높은 질의 횟수를 가지기 때문이다.
우리는 본 논문에서 PDTnet XML Schema의 특징을 잘 고려하여 이를 관계형 데이터베이스에 저장하는 두 가지 기법을 제안하였다. 또한 전용 질의 처리기를 개발함으로써, 데이터를 효율적으로 검색할 수 있으며 질의도 편리하게 할 수 있도록 하였다. 우리의 저장 기법은 PDTnet XML Schema의 불규칙적이고 반복적인 구조를 처리하는데 있어, 기존의 저장 기법들에 비해 데이터의 반복을 최소화했을 뿐 아니근}, 질의 시에 조인으로 처리하는 기존의 방식에 비해 훨씬 더 효율적이기 때문에 질의 속도를 향상 시 킬 수 있도록 하였다.
여섯 개의 질의 유형에 대한 Key-Join 기법과 String-Mining 기법의 질의 시간을 비교해보면, 전 반적으로 비슷하나, 삽입 와 조인 시에 String- Inlining 기법이 더 좋은 성능을 보임을 알 수 있다. Key-Join 기법에서는 외래키(Foreign key)가 있어서 삽입 시 참조 무결성을 체크하는 시간이 걸리므로 String-Inlining 기법보다는 느린 질의 시간을 보인다.
위의 결과에서 알 수 있듯, String-Inlining 기법이 XML-DBMS 기법보다 항상 더 빠른 질의 시간을 보이고 있으며, 참조 엘리먼트 종류의 수가 증가할수록 차이는 더 커진다.
참조되는 엘리먼트의 수를 1개에서 100개까지 증가 시키면서 질의 처리 속도를 측정해본 결과, 참조 엘리먼트의 수가 증가할수록 String-Inlining 기법이 XML-DBMS 기법보다 훨씬 빠른 것으로 나타났다. 이는 XML-DBMS 기법이 참조 속성의 데이터를 다른 릴레이션에 분리하여 저장하기 때문에, 부모 테 이블과 참조 속성 테이블의 조인이 참조 엘리먼트의 개수만큼 추가되어 일어나기 때문이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.