$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 모티프 자원 통합을 위한 데이터베이스 구축
Implementation of motif database for integrating motif sources 원문보기

한국정보과학회 02 가을 학술발표논문집(1), 2002 Oct., 2002년, pp.160 - 162  

이범주 (충북대학교 데이터베이스 연구실) ,  최은선 (충북대학교 데이터베이스 연구실) ,  류근호 (충북대학교 데이터베이스 연구실)

초록

서열 시퀀싱을 통해 등장하는 원시 데이터들을 대상으로 유사한 서열과 기능 예측에 사용되는 모티프 데이터베이스들은 원시 데이터 생성 속도가 빠르게 증가함에 따라 그 중요성 또한 나날이 증가하고 있다. 그러나, 이러한 모티프 데이터베이스들은 서로 독자적으로 개발되고 발전되어 왔기 때문에 각각 서로 다른 형식의 데이터를 사용하고 있어 이에 대한 검색결과도 데이터베이스마다 서로 이질적인 형태로 제공하고 있다. 그러므로 사용자는 각 데이터베이스에서 사용하는 데이터 구조들에 대한 전반적 지식을 습득해야 할 뿐만 아니라 중복된 반복 검색 작업을 하여야 한다. 따라서, 이 논문에서는 이러한 문제 해결을 위해 독립적인 모티프 데이터베이스들의 자원을 분해하고, 합병하는 과정을 거쳐 하나의 통합된 모티프 데이터베이스를 구축하였다. 또한 데이터베이스의 각 엔트리당 단백질의 3차 구조 정보, 분류 정보, 샘플 정보의 지원을 가능케 하여 기존 검색 조건을 개선하였다. 이 데이터베이스 구축으로서 사용자는 모티프 데이터베이스 검색에 대한 streamline적인 검색이 가능할 뿐만 아니라 기존의 통합된 데이터베이스에서 지원되지 못한 구조 정보, 분류 정보 검색을 가능케 하였다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 향후 연구로는 더 많은 모티프 데이터베이스 통합, 각각의 맴버 데이터베이스 고유의 서열 검색 메소드들의 추가 적용 및 중복성을 줄이는 연구가 진행 중이다. 그리고 각 데이터베이스들에 대한 연결기반 논리적 통합, 실제 한 데이터베이스 내에서 이루어지는 물리적 통합 및 메타 엔진만을 이용한 통합 검색에 대하여 비교 연구중이다.
  • 따라서 우리는 이러한 문제들에 대한 해결올 위해 모티프 데이터베이스들에서 제공하고 있는 플랫파일을 분석하여, 분해 및 합병 과정을 통해 중복된 데이터들을 하나의 자원으로 통합하였고, 이렇게 통합된 각 엔트리 들에 대해 3차 구조정보를 가지고 있는 PDB데이터베이 스(Protein Database), 단백질 분류 정보인 SCOP 데이터베이스 및 Swiss-Prot 데이터베이스를 통합하였다. 이로써 사용자들은 한번의 검색으로 맴버 데이터베이스 들에 대한 통합 검색이 가능해졌고 기존에 통합된 모티 프 데이터베이스에서 지원하지 못했던 구조 및 분류 정보 지원이 가능하도록 데이터베이스 기능을 개선하였다.
  • 하나의 엔트리는 축약 아이디, 풀 아이디, 타입, taxonomy, abstract, reference, 외부 문서 등에 대한 일반적인 자원들을 위한 엔티티들과 보다 많은 정보를 지원하기 위한 단백질의 3차 구조정보, 분류정보, 샘플정보 의 엔티티들을 포함하고 있다. 또한, 사용자가 통합 이전의 최초 정보들을 필요로 할 경우를 위해 entry-entry 엔티티(맴버 데이터베이스들이 통합되기 이전 엔트리들의 accession number, 아이디, 버전 정보 등을 보유한 엔티티의 버전 속성과 timestamp롤 이용하여 업데이트 참조할 수 있도록 하였다.
  • 그 후 일치하지 않는, 즉 한 데이터베이스 플랫파일에 만 존재하는 엔트리들을 하나의 새로운 엔트리로 재 생 성하여 새롭게 생성된 플랫파일에 추가 저장한다. 마지막으로, 통합된 엔트리 각각에 해당하는 단백질의 3차 구조 정보로 PDB의 엔트리 데이터를 적용하였다. 이러한 방식으로 분류 정보를 위한 SCOP, 샘플 정보를 위한 SWISS-PROT을 새로운 플랫파일에 추가 저장한다.
  • 우리는 이질적 형식의 모티프 자원을 하나로 통합하기 위해 PRINTS, Pfam, Prosite 데이터베이스에서 제공하는 각각의 플랫파일을 분석하고, 이를 분해 및 합병하였다. 먼저, 하나의 동일한 모티프를 각각의 플랫파일에서 이질적인 형태로 저장하고 있는 것들을 검색하고, 일치 하는 엔트리들올 추출하여 비교 분석한 뒤, 단일한 하나의 엔트리로 통합하여 새로운 플랫파일에 저장한다.
  • 우리는 빠르게 등장하는 단백질 서열들에 대한 기능 및 구조 예측에 사용되고 있는 모티프 데이터베이스들을 하나의 자원으로 통합하였고, 통합된 자원의 효율적 관리를 위해 새로운 관계형 데이터베이스를 설계 및 구축 하였다.
  • 우리는 위의 메소드를 통해 새롭게 생성된 플랫파일을 보다 효율적으로 검색하고 관리하기 위해 관계형 데이터 베이스를 구축하였다. 따라서, 각 데이터들의 연관성 분석을 토대로 그림 2와 같은 E-R 다이어그램을 나타내 었다.
  • 우리는 이질적 형식의 모티프 자원을 하나로 통합하기 위해 PRINTS, Pfam, Prosite 데이터베이스에서 제공하는 각각의 플랫파일을 분석하고, 이를 분해 및 합병하였다. 먼저, 하나의 동일한 모티프를 각각의 플랫파일에서 이질적인 형태로 저장하고 있는 것들을 검색하고, 일치 하는 엔트리들올 추출하여 비교 분석한 뒤, 단일한 하나의 엔트리로 통합하여 새로운 플랫파일에 저장한다.

이론/모형

  • 이 논문에서 모티프 자원 통합 메소드 및 통합 관계형 데이터베이스 구축을 위해 C와 pro*C를 사용하였고 DBMS는 Oracle8을 기반으로 하였다. 그리고 통합에 이용한 맴버 데이터베이스들 즉, Prosite, Pfam, PRINTS의 앤트리들은 다음과 같다.
본문요약 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로