정보통신연구진흥원 Institute for Information Technology Advancement
등록번호
TRKO201000018631
과제고유번호
1415086677
사업명
IT산업경쟁력강화사업
DB 구축일자
2015-01-08
초록▼
■ 한국어 처리 프로세서 - 한국어 전자사전 - 한국어 형태소 분석기 (띄어쓰기 오류등을 포함한 오류문처리가능) - 한국어 구문/의미 분석기 (띄어쓰기 오류등을 포함한 오류문처리가능) - 한국어 문장성분 분석기 (띄어쓰기 오류등을 포함한 오류문처리가능) ■ 한국어 쿼리 시스템 엔진 - 한국어 텍스트의 트리플 변환기 - 질의문의 SPARQL 변환기 ■ 트리플 리파지토리 - 빠르고 대용량의 리파지토리 시스템 - 실시간 입력, 삭제, 업데이트가 편리한 리파지토리 ■ 법률관련 온톨
■ 한국어 처리 프로세서 - 한국어 전자사전 - 한국어 형태소 분석기 (띄어쓰기 오류등을 포함한 오류문처리가능) - 한국어 구문/의미 분석기 (띄어쓰기 오류등을 포함한 오류문처리가능) - 한국어 문장성분 분석기 (띄어쓰기 오류등을 포함한 오류문처리가능) ■ 한국어 쿼리 시스템 엔진 - 한국어 텍스트의 트리플 변환기 - 질의문의 SPARQL 변환기 ■ 트리플 리파지토리 - 빠르고 대용량의 리파지토리 시스템 - 실시간 입력, 삭제, 업데이트가 편리한 리파지토리 ■ 법률관련 온톨로지 - 법령정보 OWL 온톨로지 '근로기준법', '산업재해보상법', '주택임대차보호법', '도로교통법', '교통사고처리특례법', '자동차관리법', '상속법', '상속세 및 증여세법', '관세법', '특허법' 의 법령내용을 온톨로지로 구축 - 법률서지정보 OWL 온톨로지 - 법률용어 OWL 온톨로지 상기 10개 법령 관련 법률용어를 OWL 온톨로지로 구축 - 법조기관 RDF 온톨로지 - 법률교육기관 RDF 온톨로지 - 법률서지분류 RDF 온톨로지 . ■ RDBMS의 테이블에 저장된 정보를 RDF 트리플로 변환해 주는 트리플 변환기 ■ 법률 분류체계 작성 - '근로기준법', '산업재해보상법', '주택임대차보호법', '도로교통법', '교통사고처리특례법', '자동차관리법', '상속법', '상속세 및 증여세법', '관세법', '특허법' 의 10개 대상 분야 법령에 나타나는 개념들을 총망라하여 분류체계를 작성한다. - 우선은 중분류까지의 분류깊이로 분류하고 그후 세분류 수준까지의 분류체계를 작성한다. ■ 법률 서지기호 분류체계 작성 - 서지기호는 그 자체로 정형데이터이므로 기존 서지기호 체계를 따라 분류체계를 작성한다. ■ 법률용어 OWL 온톨로지 구축 - 위에서 작성된 법률 분류체계를 OWL 온톨로지로 구축한다. - 수집된 법률 관련 용어들과 상위어(hyperonym), 하위어(hyponym), 동위어(coordinate terms), 동의어(synonym), 유의어(equivalentterms), 전체어(holonym), 부분어(meronym), 반의어(antonym) 등 그들관의 관계를 망라하여 온톨로지를 구축한다. ■ 법률 서지정보 RDF 온톨로지 구축 - 법률정보는 대개 관계형데이터베이스에 정형인 테이블의 형태로 저장되어 있으므로 이를 World Wide Web Consortium (http://www.w3.org. 이후 W3C)의 표준 N3(Notation3, http://www.w3.org/2000/10/swap/Primer.html) 기법을 이용하여 RDF 트리플로 자동변환한다. - 상기 변환은 체계적, 자동으로 이뤄지기 때문에 오류나 예외가 없다. ■ 법조기관, 법률교육기관명 수집 - 법조기관명과 법률교육기관명을 수집한다. ■ 법조기관 RDF 온톨로지와 법률교육기관 RDF 온톨로지 - 법조기관 데이터는 대개 관계형데이터베이스에 정형인 테이블의 형태로 저장되어 있으므로 이를 W3C의 표준 N3기법을 이용하여 RDF 트리플로 자동변환한다. - 상기 변환은 체계적, 자동으로 이뤄지기 때문에 오류나 예외가 없다. ■ SWRL 기반 규칙적용방식 추론엔진 개발 - 기존에 개발되어 있는 OWL DL 수준의 추론엔진을 보완하여 SWRL 수준의 실시간 규칙적용방식의 추론엔진을 개발한다. ■ 질의문 쿼리 트리플 변환 모듈 개발 및 보완 - 이미 개발되어 있는 질의문 쿼리 트리플 변환 모듈을 법률정보 검색에 맞게 보완한다. ■ 자연언어 쿼리 시스템 엔진 개발 및 보완 - 기존에 개발되어 있는 자연언어 쿼리 시스템 엔진을 법률 검색에 맞게 보완한다. ■ 시스템 테스트 및 피드백 - 법률정보 검색 테스트 스윗을 만들어 각 개발 단계별로 응답 정확률을 체크하고 피드백하여 시스템의 완성도를 관리한다. ■ 자연언어 쿼리 시스템 DB 최적화 - 시스템의 속도를 결정적으로 좌우할 DB 최적화. - 최적화할 DB는 구축된 RDF와 OWL 온톨로지를 트리플로 변환한 트리플 테이블이다. ■ 검색대상 DB 변경 실시간 갱신 연동 모듈 개발 - 검색대상 DB의 테이블의 내용이 변경되었을 때 실시간으로 변경 내용만을 트리플 테이플에 적용한다. - 검색 대상 DB의 테이블 내용의 변경된 레코드와 그 변경내용만 파악 - 변경된 레코드와 그 변경내용만 트리플 테이블에 갱신 ■ 자연언어 쿼리 시스템 관리자 인터페이스 구현 - 관리자 인터페이스는 다음 사항을 포함한다. ◆ 사용자 관리 및 인증 ◆ 도서 테이블의 트리플로의 변환 ◆ OWL 형태의 트리플로의 변환 ◆ 사용자가 검색할 대상 테이블 트리플 선택 ◆ 사용자가 활용할 온톨로지 트리플 선택 ■ 자연언어 쿼리 시스템 사용자 인터페이스 구현 - 사용자 인터페이스는 다음 사항을 포함한다. ◆ 사용자 인증 ◆ 검색할 대상 테이블 트리플 선택 ◆ 활용할 온톨로지 트리플 선택 ◆ 질의문 입력 ◆ 응답 출력 ■ 시스템 테스트 및 피드백 - 도서 검색 테스트 스윗을 만들어 각 개발 단계별로 응답 정확률을 체크하고 피드백하여 시스템의 완성도를 관리한다. ■ 시스템 매뉴얼 작성 - 판매를 위한 시스템 매뉴얼을 작성한다.
Abstract▼
● Natural language processing ● Morphological, phrasal, sentence constituent analysis of korean sentences ● Extraction of sufficient semantic features - 65 semantic features of stem - 56 semantic features of ending ● Correct analysis of ill-formed korean sentences - Korean sentence
● Natural language processing ● Morphological, phrasal, sentence constituent analysis of korean sentences ● Extraction of sufficient semantic features - 65 semantic features of stem - 56 semantic features of ending ● Correct analysis of ill-formed korean sentences - Korean sentences without spacing words - contracted expression like "맹셀합니다", "좋은걸어떡해" ● Korean query processing ● Conversion of korean sentences into TRIPLE ● Conversion of korean interrogative sentences into SPARQL ● Triple repository processing ● Fast and large-capacity repository processing ● Real-time input, deletion, update ● Conversion of data of RDBMS into TRIPLE format using Notation3 method ● Inference engine ● OWL DL level inference engine ● Forward chaining ● Ontologies and taxonomy ● Legal ontology ● Legal taxonomy
※ AI-Helper는 부적절한 답변을 할 수 있습니다.