최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회, 2018 Oct. 12, 2018년, pp.570 - 573
손성환 (국민대학교 컴퓨터공학과) , 이현영 (국민대학교 컴퓨터공학과) , 남규현 (국민대학교 컴퓨터공학과) , 강승식 (국민대학교 컴퓨터공학과)
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
순환망 방식은 어떻게 문자열을 생성하는가? | 기계 학습은 주어진 학습 데이터의 패턴을 익히고 그것을 토대로 데이터를 분별하거나 생성하는 모델을 만들어낸다. 그중에서 순환망 방식은 어떤 단어 혹은 글자가 시작값(Seed)으로 주어지면, 그 시작값을 시작으로 패턴에 일치하는 문자열을 생성한다. 일반적으로 학습 데이터에 없는 새로운 문자열들을 그럴듯하게 생성한다. | |
자연어 생성에 여전히 많은 문제들이 존재하는 이유는? | 자연어 생성은 지속적인 연구로 점차 발전하고는 있지 만, 여전히 많은 문제들이 존재한다. 대부분의 언어 모델은 결국은 학습 문자열들이 가지고 있는 패턴을 익히고 나열하는 것이기 때문에 적어도 짧고 간단한 문장은 사람 못지않은 훌륭한 문장을 생성하는 것이 가능하다. 그러나 문장이 길고 복잡해지거나 2개 이상의 문장을 생성할 때 문맥이 고려된 매끄러운 문장 및 문단을 생성하는 것은 힘든 일이다. 왜냐하면 문맥을 고려한 창조적인 글은 언어에 대한 고차원적인 이해가 필요하기 때문이다. | |
순서 데이터에 속하는 문자열이나 영상 같은 경우, 어디에 속하는 학습 모델을 사용하여 학습하는가? | 순서 데이터(Sequence Data)에 속하는 문자열이나 영상 같은 경우 주로 순환신경망(Recurrent Neural Network; RNN)에 속하는 학습 모델을 사용하여 학습하는 것이 일반적이다. 기본적인 순환신경망의 경우 초기에 학습이 지속될수록 학습과정에서 과거에 입력된 정보를 잃어버리는 기울기 소멸(Vanishing Gradient)문제로 실질적으로 사용되는데 어려움이 있었다. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.