최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회, 2009 Oct. 09, 2009년, pp.106 - 110
이순웅 (한국과학기술원 시맨틱웹 연구센터) , 최기선 (한국과학기술원 시맨틱웹 연구센터)
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
웹상의 많은 데이터가 구조화되지 않은 형태인 자연어 텍스트로 존재하는 이유는 무엇인가? | 하지만 웹상의 많은 데이터가 구조화되지 않은 형태 즉 자연어 텍스트로 존재한다. 이는 사람이 정보를 기록하는 가장 손쉬운 방법 중의 하나가 자연어 텍스트로 기록하는 것이기 때문이다. 이러한 구조화되지 않은 데이터에 대해 효과적인 정보 검색을 하기 위해서는 데이터를 기계가 해석할 수 있는 구조화된 형태로 바꾸어야 한다. | |
비구조화된 대량의 텍스트로부터 트리플을 추출하기 위한 시스템인 KnowItAll은 초기에 어떤 방법으로 트리플을 추출하였는가? | 비구조화된 대량의 텍스트로부터 트리플을 추출하고자 하는 연구가 활발히 이루어지고 있는데, 그 중 KnowItAll[2]은 공개된 첫 번째 시스템이었다. 대량의 웹 코퍼스에서 비지도학습 방법으로 트리플을 추출하기 위해 패턴을 사용하였는데, 초기에 지정된 패턴에 해당하는 트리플들만 추출하는 방법을 사용하였다. 패턴은 품사 태깅 정보와 개체명 인식기 등을 사용하여 정의하였다. KnowItAll을 개량한 것이 TextRunner[3]이다. | |
DBPedia의 목표는 무엇인가? | 이에 따라 데이터를 어떻게 구조화 할 것인지와 구조화된 데이터에서 어떻게 하면 정확한 정보를 찾을 것인지에 대한 시도가 많이 이루어지고 있다. DBPedia[1]는 그러한 시도 중 하나로써, 위키피디아의 정보를 RDF 트리플 형태로 바꾸는 것을 목표로 하고 있다. 이를 통해 기존 키워드 방식 검색에 비해 훨씬 정교한 검색 결과를 제공하고자 한다. 하지만 웹상의 많은 데이터가 구조화되지 않은 형태 즉 자연어 텍스트로 존재한다. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.