온라인상에 전문 자료가 공개되고 검색이 가능해짐에 따라, 법률적 도움이 필요한 사람들이 포털 사이트에 질의하거나 본인의 사건과 비슷한 사건의 판례를 검색하여 스스로 소송을 준비하는 경우가 늘어나게 되었다. 그러나 법률적 전문 지식이 없는 일반 사용자가 법률 정보를 검색할 경우 용어 사용의 차이로 검색 과정에서 정확한 결과를 도출하지 못하는 문제가 있다. 또한 현재 대법원 판례 사이트의 판례 검색 시스템은 키워드 기반 검색 시스템으로 사용자 맞춤형 정보를 제공하는 데 한계가 있다. 따라서 일반 사람들이 성공적으로 법률 정보를 검색하기 위해 일반 용어를 사용하고도 법률 정보가 검색될 수 있어야 하며, 사용자에게 최대한 맞춤형 정보가 도출될 수 있도록 해야 한다. 이에 본 논문은 텍스트 마이닝 기법을 이용하여 법률적 전문 지식이 없는 사용자가 일반 용어를 사용한 질의문을 바탕으로 사용자의 질의문과 연관 관계에 있는 판례를 효과적으로 연계하기 위한 방법을 제시하였다. 질의문과 판례를 연결하는 방법으로는 먼저 사용자 질의문·답변과 판례를 수집한 후 답변 데이터에 ...
온라인상에 전문 자료가 공개되고 검색이 가능해짐에 따라, 법률적 도움이 필요한 사람들이 포털 사이트에 질의하거나 본인의 사건과 비슷한 사건의 판례를 검색하여 스스로 소송을 준비하는 경우가 늘어나게 되었다. 그러나 법률적 전문 지식이 없는 일반 사용자가 법률 정보를 검색할 경우 용어 사용의 차이로 검색 과정에서 정확한 결과를 도출하지 못하는 문제가 있다. 또한 현재 대법원 판례 사이트의 판례 검색 시스템은 키워드 기반 검색 시스템으로 사용자 맞춤형 정보를 제공하는 데 한계가 있다. 따라서 일반 사람들이 성공적으로 법률 정보를 검색하기 위해 일반 용어를 사용하고도 법률 정보가 검색될 수 있어야 하며, 사용자에게 최대한 맞춤형 정보가 도출될 수 있도록 해야 한다. 이에 본 논문은 텍스트 마이닝 기법을 이용하여 법률적 전문 지식이 없는 사용자가 일반 용어를 사용한 질의문을 바탕으로 사용자의 질의문과 연관 관계에 있는 판례를 효과적으로 연계하기 위한 방법을 제시하였다. 질의문과 판례를 연결하는 방법으로는 먼저 사용자 질의문·답변과 판례를 수집한 후 답변 데이터에 클러스터링 기법을, 판례 데이터에 LDA기반 토픽 모델링 기법을 사용하여 각 데이터를 키워드와 관련된 문서로 군집화하여 문서의 주제를 분석하였다. 이는 답변과 판례를 일치하는 주제끼리 연결시켜 주어 답변을 매개로 질의문과 판례를 연결하도록 하였다. 그 결과, LDA 모델링의 한계로 일부 질의문과 판례가 연결이 불가능하였으나, 이를 제외한 나머지 전문가 답변 범주와 판례 상위어는 주제별로 잘 연결되어 질의문과 판례가 성공적으로 도출됨을 확인하였다. 이러한 연결 결과는 검색 시스템 개발 측면에서 시스템상에 질의문과 판례 범주 목록으로 제공될 수 있으며, 사용자는 한층 더 쉽게 맞춤형 정보를 얻을 수 있을 것이다.
온라인상에 전문 자료가 공개되고 검색이 가능해짐에 따라, 법률적 도움이 필요한 사람들이 포털 사이트에 질의하거나 본인의 사건과 비슷한 사건의 판례를 검색하여 스스로 소송을 준비하는 경우가 늘어나게 되었다. 그러나 법률적 전문 지식이 없는 일반 사용자가 법률 정보를 검색할 경우 용어 사용의 차이로 검색 과정에서 정확한 결과를 도출하지 못하는 문제가 있다. 또한 현재 대법원 판례 사이트의 판례 검색 시스템은 키워드 기반 검색 시스템으로 사용자 맞춤형 정보를 제공하는 데 한계가 있다. 따라서 일반 사람들이 성공적으로 법률 정보를 검색하기 위해 일반 용어를 사용하고도 법률 정보가 검색될 수 있어야 하며, 사용자에게 최대한 맞춤형 정보가 도출될 수 있도록 해야 한다. 이에 본 논문은 텍스트 마이닝 기법을 이용하여 법률적 전문 지식이 없는 사용자가 일반 용어를 사용한 질의문을 바탕으로 사용자의 질의문과 연관 관계에 있는 판례를 효과적으로 연계하기 위한 방법을 제시하였다. 질의문과 판례를 연결하는 방법으로는 먼저 사용자 질의문·답변과 판례를 수집한 후 답변 데이터에 클러스터링 기법을, 판례 데이터에 LDA기반 토픽 모델링 기법을 사용하여 각 데이터를 키워드와 관련된 문서로 군집화하여 문서의 주제를 분석하였다. 이는 답변과 판례를 일치하는 주제끼리 연결시켜 주어 답변을 매개로 질의문과 판례를 연결하도록 하였다. 그 결과, LDA 모델링의 한계로 일부 질의문과 판례가 연결이 불가능하였으나, 이를 제외한 나머지 전문가 답변 범주와 판례 상위어는 주제별로 잘 연결되어 질의문과 판례가 성공적으로 도출됨을 확인하였다. 이러한 연결 결과는 검색 시스템 개발 측면에서 시스템상에 질의문과 판례 범주 목록으로 제공될 수 있으며, 사용자는 한층 더 쉽게 맞춤형 정보를 얻을 수 있을 것이다.
As professional data is available and searchable online, more and more people in need of legal help are preparing their own lawsuits by inquiring on portal sites or searching for legal cases similar to their own cases. However, if a lay user without legal expertise retrieves legal inform...
As professional data is available and searchable online, more and more people in need of legal help are preparing their own lawsuits by inquiring on portal sites or searching for legal cases similar to their own cases. However, if a lay user without legal expertise retrieves legal information, there is a problem that differences in the use of terminology do not produce accurate results in the search process. In addition, the current legal case search system on the Supreme Court case site is a keyword-based search system, so there is a limit to providing customized information. Therefore, in order for ordinary people to successfully retrieve legal information, legal information must be able to be retrieved even after using generic terms, and the user must be able to derive as much customized information as possible. Using text mining techniques, this paper proposed a method for effectively connecting legal cases related to a user's query based on a query using general terminology by users without legal expertise. As a way to connect questions and cases, first we collected user questions, answers and cases, and we used clustering techniques for answer data, and LDA-based topical modeling techniques for case data. Each data was clustered into the relevant documents to analyze the subject matter of the document. The answer was used as a medium to connect the questions and cases to the same topics. As a result, some questions and cases were not able to be connected due to the limitations of LDA modeling, but the rest of the expert answer categories and cases were well connected by subject, confirming that the questions and cases were successfully derived. These connection results can be provided as a list of query and case categories on the system in terms of search system development, making it easier for users to obtain customized information.
As professional data is available and searchable online, more and more people in need of legal help are preparing their own lawsuits by inquiring on portal sites or searching for legal cases similar to their own cases. However, if a lay user without legal expertise retrieves legal information, there is a problem that differences in the use of terminology do not produce accurate results in the search process. In addition, the current legal case search system on the Supreme Court case site is a keyword-based search system, so there is a limit to providing customized information. Therefore, in order for ordinary people to successfully retrieve legal information, legal information must be able to be retrieved even after using generic terms, and the user must be able to derive as much customized information as possible. Using text mining techniques, this paper proposed a method for effectively connecting legal cases related to a user's query based on a query using general terminology by users without legal expertise. As a way to connect questions and cases, first we collected user questions, answers and cases, and we used clustering techniques for answer data, and LDA-based topical modeling techniques for case data. Each data was clustered into the relevant documents to analyze the subject matter of the document. The answer was used as a medium to connect the questions and cases to the same topics. As a result, some questions and cases were not able to be connected due to the limitations of LDA modeling, but the rest of the expert answer categories and cases were well connected by subject, confirming that the questions and cases were successfully derived. These connection results can be provided as a list of query and case categories on the system in terms of search system development, making it easier for users to obtain customized information.
주제어
#텍스트 마이닝 클러스터링 토픽 모델링 문서 군집 용어 대응 질의문 판례 일반용어 법률 용어 Text mining clustering topical modeling document clusters questions legal cases general terms legal terms term mapping
학위논문 정보
저자
강예지
학위수여기관
연세대학교 대학원
학위구분
국내석사
학과
언어정보학협동과정 말뭉치언어학전공
지도교수
김한샘
발행연도
2020
총페이지
vi, 96 p.
키워드
텍스트 마이닝 클러스터링 토픽 모델링 문서 군집 용어 대응 질의문 판례 일반용어 법률 용어 Text mining clustering topical modeling document clusters questions legal cases general terms legal terms term mapping
※ AI-Helper는 부적절한 답변을 할 수 있습니다.