$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

연관법령 검색을 위한 워드 임베딩 기반 Law2Vec 모형 연구
A Study on the Law2Vec Model for Searching Related Law 원문보기

디지털콘텐츠학회 논문지 = Journal of Digital Contents Society, v.18 no.7, 2017년, pp.1419 - 1425  

김나리 (고려대학교 빅데이터응용및보안학과) ,  김형중 (고려대학교 빅데이터응용및보안학과)

초록
AI-Helper 아이콘AI-Helper

법률 지식 검색의 궁극적 목적은 법령과 판례를 근거로 최적의 법례정보 획득이라고 할 수 있다. 최근, 대규모 자료에서 효율적으로 검색하여야 하는목적을 달성하기 위하여텍스트 마이닝 연구가 활발히 이루어지고 있다. 대표적인 방법으로 Neural Net 기반 학습방법인 워드 임베딩 알고리즘을 들 수 있다. 본 논문에서는 한국 법령정보를 워드임베딩에 적용하여 연관정보 검색방법을 연구하였다. 우선 판례의 참조법령을 순서대로 추출하여 모형의 입력정보로 활용하였다. 추출한 참조법령들은 중심법령을 기준으로 주변 법령을 학습하고 임베딩하는 Law2Vec 모형을 작성하였다. 이 모형으로 법령에 대하여 학습을 수행하고 법령 간의 관계를 추론하였다. 본 연구의 모형을 평가하기 위하여 연관법령으로 도출된 결과가 키워드와 밀접한 관련이 있는지 정밀도와 재현율을 계산하여 검증하였다. 실험결과, 본 연구의 제안방식이기존의 키워드 검색방법보다 연관된 법령을추론하는데유용함을 알 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

The ultimate goal of legal knowledge search is to obtain optimal legal information based on laws and precedent. Text mining research is actively being undertaken to meet the needs of efficient retrieval from large scale data. A typical method is to use a word embedding algorithm based on Neural Net....

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • Corpus는 모든 텍스트 데이터를 대상으로 분석을 수행하는것이 이상적이나, 시간과 자원의 한계를 고려하여 특정 주제를선정하고 이에 대한 사례 연구를 진행하였다. 특정주제로써 ‘소멸시효’,‘손해배상’으로 검색한 판례를 수집하였다.
  • Word2Vec이 문장에 등장하는 중심단어와 주변단어의 분포정보를 분석하여 중 심단어의 의미를 유추하는 것처럼, Law2Vec은 판례에 참조된 법령의 분포를 분석하여 특정 법령과 연관된 법령정보를 추론한다. 기존의 Word2Vec을 적용할 때 발생하는 한글 형태소 분석 및 자연어 처리(NLP)의 어려움을 개선하기 위하여 본 연구에서는 구분자 콤마(,)를 기준으로 법령을 파싱(parsing)하고 연관관계를 분석하였다. 따라서 Law2Vec 모형은 법령 본문을input하는 것이 아니라 법령 조항을 input하고 학습함으로써,  복잡한 한글 전처리의 어려움을 해결하고 결과적으로 연관법령 검색 성능을 높이고자 하였다.
  • 따라서 Law2Vec 모형은 법령 본문을input하는 것이 아니라 법령 조항을 input하고 학습함으로써,  복잡한 한글 전처리의 어려움을 해결하고 결과적으로 연관법령 검색 성능을 높이고자 하였다.
  • 본 논문에서 법률정보 검색의 효율성을 제고하기 위하여 법령, 판례를 분석해 연관법령정보를 제공하는 방법을 연구하였다. 이 연구의 효과는 정확한 내용을 모르더라도 검색어와 연관된 법령정보를 ‘쉽고, 정확하게‘ 검색하는 것이다.
  • 본 논문에서는 Word2Vec을 참고로 법령 및 판례를 대상으로 학습을 통하여 법령들을 벡터화하고 법령 간 관련성을 추론하는 법령 기반 Law2Vec 모형을  제안한다.
  • 기존에는 법령을 검색하는 경우, 연관법령을 찾으려면 검색어를 여러 번 수정하거나 판례 내용의 법령정보를 참고하기 위하여 많은 판례를 열람해야하는 번거로움이 있었다. 본 연구에서 법령 간 유사도 검색으로 연관법령을 쉽게 검색할 수 있는 새로운 방법을 제시하고 이론적 근거를 마련함으로써 법령 활용의 효과를 높일 수 있을 것으로 여겨진다
  • 본 연구에서는 이러한 문제점을 극복하기 위하여 국내 법령 정보의 특성을 고려하여 법령정보를 분석할 수 있는 방안에 대한 연구를 진행하였다. 국내 법령을 유의미한 벡터로 계산하고 이를 학습하여 법령 간 연관관계를 추론하였다.
  • 따라서 연관법령을 검색할 수 있는 정보 검색 기법에 대한 연구가 요구된다(표 1 참조). 본 연구에서는 판례를 학습하여 법령의 관계를 도출하고 연관법령을 추론할 수 있는 방법을 연구하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
법률정보 검색은 무엇인가? 법률정보 검색은 개인이나 기업, 그리고 국가기관의 판사, 검사, 수사관에 이르기까지 법률적 판단과 해석에 필요한 근거규정을  찾는데 활용하는 수단으로, 경우에 따라서는 많은 시간과 노력이 투입되는 일이다. 국가법령정보센터에 수록된 현재 유효한 법령[1]이 약 5천 개에 이르고, 법리를 해석한 판례의 수가 증가하고 복잡해짐에 따라 효율적인 정보 검색에 대한 요구는 크게 늘고 있다.
법률 실무가에게 검색 문제의 어려움을 해결하는 대안이 될 수 있는 방법과 그 이유는 무엇인가? 그런데 빅데이터 분석 방법인 텍스트 마이닝을 활용하여  법률을 검색하면 정확한 단어와 용어를 모르더라도 주요 개념과 테마를 캡처하여 숨겨진 의미와 관계를 알아낼 수 있다. 이 방법은 법률 실무가에게 검색 문제의 어려움을 해결하는 대안이 될 수 있다.
Law2Vec은 어떻게 법령정보를 추론하는가? 본 논문에서는 Word2Vec을 참고로 법령 및 판례를 대상으로 학습을 통하여 법령들을 벡터화하고 법령 간 관련성을 추론하는 법령 기반 Law2Vec 모형을  제안한다. Word2Vec이 문장에 등장하는 중심단어와 주변단어의 분포정보를 분석하여 중 심단어의 의미를 유추하는 것처럼, Law2Vec은 판례에 참조된 법령의 분포를 분석하여 특정 법령과 연관된 법령정보를 추론한다. 기존의 Word2Vec을 적용할 때 발생하는 한글 형태소 분석 및 자연어 처리(NLP)의 어려움을 개선하기 위하여 본 연구에서는 구분자 콤마(,)를 기준으로 법령을 파싱(parsing)하고 연관관계를 분석하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (19)

  1. Statute Status Report , [Internet] available at http://www.moleg.go.kr/lawinfo/status/statusReport 

  2. H. J. Jeon, "Legal Tech Industry Status and Implications," Hyundai Research Institute, vol. 16-31. no. 669. pp. 1-11. Dec 2016. 

  3. M. H, Koh, "A Study on Advancement Provision of Legal Information," Korea Ministry of Government Legislation, no. 11-1170000-000460-01, pp. 1-121. Sep 2012. 

  4. I. H. Chang, "Developing and Evaluating an Ontology-based Legal Retrieval System," Journal of the Korean Society for Library and Information Science, vol. 45, no. 2, pp. 345-366, Mar 2011. 

  5. M. J. Won, "A Development of Ontology-Based Law Retrieval System: Focused on Railroad R&D Projects," Journal of Society for e-Business Studies, vol. 20, no. 4, pp. 209-225, Nov 2015. 

  6. J. H. Kim, "A Study on Legal Ontology Construction," Journal of the Korea Society of Computer and Information, vol. 19, no. 11, pp. 105-113, Nov 2014. 

  7. J.H. Kim, "Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System," Journal of Intelligence and Information Systems, vol. 18, no. 3, pp. 137-152, Sep 2012. 

  8. J. S. Shim, "A Searching Method for Legal Case Using LDA Topic Modeling," Journal of the Institute of Electronics and Information Engineers, vol. 54, no. 9, pp. 67-75, Sep 2017. 

  9. J. H. Kim, "Exploring the Lawyers' Legal Information Seeking Behaviors for the Law Practice," Journal of the Korean Society for Information Management, vol. 32, no. 4, pp. 55-76, Dec 2015. 

  10. T. Young, D. Hazarika, S. Poria, and E. Cambria, "Recent Trends in Deep Learning Based Natural Language Processing," arXiv preprint arXiv:1708.02709, 2017. 

  11. Y. Bengio, R. Ducharme, P. Vincent et al., "A neural probabilistic language model," Journal of Machine Learning Research, vol. 3, pp. 1137-1155, 2003. 

  12. H. Y. Lee, and J. S. Lee, "Functional Expansion of Morphological Analyzer Based on Longest Phrase Matching For Efficient Korean Parsing," Journal of Digital Contents Society, vol. 17, no. 3, pp. 203-210, Jun. 2016. 

  13. T. Mikolov, K. Chen, G. Corrado, and J. Dean, "Efficient Estimation of Word Representations in Vector Space," arXiv:1301.3781v3, 2013. 

  14. R. Andrii, "Semiotic Analysis of Korean Legal Terms," Journal of Korean Culture, vol. 10, pp. 26-30, Feb 2008. 

  15. C. Park, K. Kim, and D. Seong, "Automatic IPC Classification of Patent Documents Using the Term Clustering," Journal of Korean Institute of Information Technology, vol. 12, no. 9, pp.127-139, Sep 2014. 

  16. Z. S. Harris, "Distributional Structure," Word, vol. 10, no. 2-3, pp. 146-162. 1954. 

  17. Word2Vec Research, [Internet] available at https://ratsgo.github.io/from%20frequency%20to%20semantics/2017/03/11/embedding/ 

  18. Word2Vec Tutorial, [Internet] available at https://rare-technologies.com/deep-learning-with-Word2vec-and-gensim/ 

  19. K. Y. Lee, "Jurisprudence for the Advancement of the Statute of Limitations in Korean Civil Law," Ministry of Justice, Republic of Korea, Research Report, Dec 2007. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로