최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기컴퓨터교육학회논문지 = The Journal of Korean Association of Computer Education, v.18 no.6, 2015년, pp.81 - 88
윤보현 (목원대학교 컴퓨터교육과) , 오효정 (전북대학교 대학원 기록관리학과, 문화융복합 아카이빙 연구소)
Along with advent of Web 3.0 era and advanced technologies of IoT(Internet of Things), massive amounts of information are generated. Reflecting this trend, this paper developed a semi-automatic construction tool for named entity dictionary based on active learning. Our proposed method chose error ca...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
능동 학습 방법이란? | 일반적으로 기계 학습(machine learning)을 위해서는 수작업으로 정답이 부여된(labeled) 다수의 학습 데이터가 필요하다. 능동 학습 방법은 학습 예제로 사용할 수 있는 예제의 수가 제한되어 있는 상황에서 학습에 가장 도움이 되는 데이터를 선택하여 전문가의 태깅 혹은 검증에 의해 훈련 집합에 포함시키거나, 초기 훈련 집합이 주어지지 않았을 경우에 전체 데이터 분포를 잘 나타내는 데이터 부분 집합을 선택하여 훈련 집합을 만드는 방법으로[4], 학습에 필요한 예제 생성 비용을 효과적으로 줄이기 위해 다양한 분야에서 적용되고 있다. | |
개체명 사전은 무엇으로 구성되어 있는가? | 이때 사용자들의 관심이 높은 정보라 함은 주로 특정 개체에 대한 것으로, 본 논문에서는 특히 개체명에 초점을 두기로 한다. 개체명(Named Entity)이란 인명, 지명, 기관명, 날자, 시간 등 문장에서 핵심적인 의미를 지닌 고유명사나 미등록어 등을 말하는 것으로[1], 개체명 사전은 해당 개체명과 분류 태그(tag)로 구성되어 있다(예: 인명-홍길동). | |
위키피디아 분류정보를 활용하여 개체명의 중의성을 해소하는 기법을 적용하여 높은 성능을 내기 위해서 어떻게 해야 하는가? | 무엇보다도 가장 근본적으로 위와 같은 방법을 적용하여 높은 성능을 내기위해서는 많은 양의 코퍼스(corpus)를 필요로 하며, 그에 따른 수작업 비용을 요구한다. 뿐만 아니라 많은 양의 코퍼스를 구축하였다 하더라도, 새로운 도메인에 최적화된 개체명 인식기를 개발하기 위해서는 새로운 코퍼스가 필요하기 때문에 이러한 교사기반(supervised) 기계학습 기법은 확장성이 떨어진다. |
Goldman Sachs (2014), The Internet of Things: Making sense of the next mega-trend, IoT Primer, http://www.goldmansachs.com/our-thinking/outlook/internet-of-things/iot-report.pdf
정유선 (역) (2008), Web 3.0. (Team Weboook)서울: 라이온북스
Wikipedia, history, https://en.wikipedia.org/wiki/Wikipedia:About
Settles, B. (2009). Active learning literature survey: Computer sciences technical report 1648, University of Wisconsin-Madison,
Lewis, D. & Gale, W. (1994). A sequential Algorithm for Training Text Classifiers. The Proceedings of ACM-SIGIR Conference, 3-12.
Olsson, Fredrik (2009). A literature survey of active machine learning in the context of natural language processing, SICS Technical Report T2009:06
Vlachos, Andreas (2006). Active annotation. The Proceedings of the Workshop on Adaptive Text Extraction and Mining (ATEM 2006), 64-71.
Toral A. & Munoz, R. (2006). A proposal to automatically buid and maintain gazetters for named entity recognition by using Wikipedia", The Proceedings of EACL, 56-61
송영길, 정석원, 김학수 (2015). 위키피디아를 이용한 정보검색 기반 개체명 사전 구축 방법. 2015년 한국컴퓨터종합학술대회 논문집, 648-659
김태현, 이창수, 황재원, 고영중 (2015). 위키 피디아를 이용한 개체명 부착 코퍼스 자동구축 및 중의성 해소, 2015년 한국컴퓨터종합 학술대회 논문집, 745-747
류법모, 김현진, 김현기, 박상규 (2012). 심층 언어분석 기반 소셜미디어 이슈 탐지 분석 기술, 정보과학회지, 30(6), 57-68
Lee, C., Hwang, Y. & Jang, M. (2007). Fine-Grained Named Entity Recognition and Relation Extraction for Question Answering, The Proceedings of the ACM-SIGIR conference, 799-800
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.