$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

웹 문서 정보추출과 자연어처리를 통한 온톨로지 자동구축에 관한 연구
A Study of Automatic Ontology Building by Web Information Extraction and Natural Language Processing 원문보기

한국인터넷방송통신·TV학회논문지 = The Journal of The Institute of Webcasting, Internet Television and Telecommunication, v.9 no.3, 2009년, pp.61 - 67  

김명관 (을지대학교 의료산업학부) ,  이영우 (을지대학교 컴퓨터정보과)

초록
AI-Helper 아이콘AI-Helper

인터넷의 발달로 전자문서가 증가함에 따라, 정보검색기술의 중요성도 함께 증가하게 되었다. 본 연구는 비정형 텍스트 웹 문서로부터 사용자가 요구하는 핵심 의미 지식을 추출하기 위하여 LGG(Local Grammar Graph) 구축에 기반 하여 보다 효율적이고 정확한 지식구축을 가능하게 한다. 주가등락이라는 특정 분야의 패턴을 추출하여 만든 패턴 문법을 사용해서 OWL(Web Ontology Language) 기반의 온톨로지를 구축하였다. 특정 분야의 온톨로지를 구축함으로써 기존 검색에서 할 수 없었던 지식의 의미 검색이 가능하며 나아가 사용자가 원하는 질의에 대한 정보의 추론이 가능할 것이다.

Abstract AI-Helper 아이콘AI-Helper

The proliferation of the Internet grows, according to electronic documents, along with increasing importance of technology in information retrieval. This research is possible to build a more efficient and accurate knowledge-base with unstructured text documents from the Web using to extract knowledg...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 증권분야의 등락에 대한 의미 지식을 추출하기 위하여 UNITEX 프로그램을 사용하여 LGG 문법들을 구현한다.
  • 본 연구는 특정영역의 문서에서 나타내는 의미지식을 추출하기 위한 연구로 귀납적인 방식으로 어휘 • 통사적 속성을 기술하는 LGG 문법 구현을 통한 온톨로지 자동 구축에 관하여 논의한다.
  • 본 연구에서 구축하고자 하는 LGG-주식정보 등락은 한국재경신문의 웹 텍스트를 기반으로 주식의 등락에 관련된 의미지식 패턴을 귀납으로 검토한 후 이러한 지식이 실현되는 자연어 문장들을 추출하여 이를 바탕으로 특정영역의 의미지식 데이타베이스를 자동 구축하는 것이 목적이다. 이를 위하여 한국재경신문 2007년도 인터넷 기사 3개월 치 분량을 발췌하여 검토하여 이를 기반으로 LGG를 구축 하였다.
  • 실제로 특정 영역으로 한정된 비정형 텍스트를 관찰해 보면 극히 제한된 어휘유형과 구문적 속성이 포착되는 것을 확인할 수 있다. 본 연구에서는 주식분야의 등락을 관련 의미 지식으로 핵심이 되는 정보유형인 회사명[NameOfCompany]과 등락율[Numeral], 주가등락[StockOfDown], [StockOfUp]의 유형으로 분류하여 이들에 대한 LGG 그래프를 구축하고, 구축된 LGG 그래프를 바탕으로 OWL언어를 사용하여 특정분야의 온톨로지를 만들어 보는 것을 구현하였다.
  • 본 연구에서는 특정 영역의 텍스트에서 사용자가 요구하는 핵심적인 의미 정보를 추출하기 위한 어휘 • 문법 패턴을 LGG 방법론에 기반하여 구현하는 문제에 대하여 논의 하였다.
  • 온톨로지 구축에는 다양한 방법들이 시도되고 있지만, 본 논문에서는 LGG(Local-Grammar Graph) 방법론에 기반하여 어휘-통사적 언어 정보를 기술하는 것을 목적으로 비정형 웹 문서로부터 개념들을 추출하여 다른 표현의 동일한 개념들을 그룹화 시켜 패턴으로 만든 후 만들어진 패턴문법을 기반으로 온톨로지를 구축하는 방법을 사용하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
온톨로지는 무엇인가? 온톨로지는 주어진 한 영역(domain) 내에서의 개체들에 대한 관계를 정의하는 것으로 일련의 개념들과 그 개념들 사이의 일정 관계들을 표상하는 데이터 모델이다.
RDF triple 형식을 사용하면 무엇이 가능한가? 세번째는 ”목적어부(Object)"부분으로 “Predicate"에서 명시하는 분야의 값을 나타낸다[8]. 위와 같은 RDF triple 형식을 사용하면 일반적인 자연어문장의 표현이 가능하게 되고, triple 형식을 가지는 특정분야의 온톨로지 구축이 가능하게 된다.
LGG 문법의 특징은 무엇인가? LGG(Local Grammar Graph)문법은 프랑스 전산어학자 모리스 그로스 (Maurice Gross)에 의해 제안된 언어 기술 모델로서 특정 영역별로 부분적인 언어 정보를 유한 오토마타 (FSA: Finite-State Automata) 문법의 형태로 구현하여 이를 이용하여 자연언어 텍스트에 대한 자동 분석 및 생성, 정보 추출 등을 수행하는 것을 목적으로 한다[4]. 특징으로는 문법을 방향성 비순환 그래프(Directed Acyclic Graph) 방식으로 구성함으로써 문법 구성의 용이성과 문법에 대한 가독성을 극대화하였다. 또한 제한된 문맥에서 나타내는 중의성의 문제를 해결하기 위한 중의성 해소문법을 구성하는 데에도 사용된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. 남지순. 웹 문서 의미 지식 추출을 위한 LGG의 구축. 한국프랑스어문교육학회논문지, 25권, 한국프랑스어문교육학회, 2007년, pp. 105-128. 

  2. T.R. Gruber, "A Translation Approach to Portable Ontologies", Knowledge Acquisition. 5(2). pp. 199-200, 1993. 

  3. 최호섭, 옥철영 정보검색 시스템과 온토로지. 정보과학회지, 제22권, 제4호, 한국정보과학회, 2004년, pp. 62-71 

  4. 남지순, 프랑스 언어 자원 구축을 위한 부분문법(Grammaire locale)방법론의 소개. 한국프랑스학회논문지, 제 49권, 한국프랑스학회, 2005년, pp. 67-94. 

  5. 민경구, 선충녕, 서정연, 문맥과 위치정보를 사용한 정보추출. 2005 한국컴퓨터종합학술대회, 제32권, 제1호, 한국정보과학회, 2005년, pp. 490-492 

  6. 임윤선 김 명. 온톨로지 기반 지식획득 방법에 대한 연구. 2006 한국컴퓨터종합학술대회, 제 33권, 제1호, 한국정보과학회, pp. 118-120 

  7. 장명길, 김현진, 장문수, 최재훈, 오효정, 이충희, 허정. 의미기반 정보검색, 정보과학회지, 제19권, 제10호, 한국정보과학회, 2001년, pp. 7-18 

  8. 신희영, 정동원, 김진형, 백두권. Jena2 기반의 효율적인 OWL Ontology 관리를 위한 저장모델. 2007 한국컴퓨터종합학술대회, 제 34권, 제 1호, 한국정보과학회, 2007년, pp. 144-148. 

  9. 이승우, 정한민, 성원경. R-DBMS 기반 추론 서비스인 OntoThink-K에서의 SPARQL 질의지원, 한국정보과학회지, 제 33권, 제 2호, 한국정보과학회, 2006년, pp. 223-227. 

  10. 민영근, 이복주, 온톨로지 자동 구축을 위한 서술어 온톨로지, 정보처리학회지, 제 15권, 제 1호, 2008년, pp. 28-31 

  11. M. Gross, "The Construction of Local Grammars, in Finite-state Language Processing", the MIT Press. 1997. 

  12. C. T. Meadow, "Text Information Retrieval Systems", Academic Press, Inc., pp. 201-211, 1992. 

  13. T. Berners-Lee, J. Hendier, OraLassila, "The Semantic Web", Scientific American, 2001. 

  14. 한용진, 박세영, 이영화, 김권양. Event 온톨로지 기반의 의미 정보 검색. 2007 한국컴퓨터종합학술대회, 제 34권, 제 1호, 한국정보과학회, 2007년, pp. 95-96 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로