최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기국가/구분 | 한국(KR)/등록특허 | |
---|---|---|
국제특허분류(IPC8판) |
|
|
출원번호 | 10-2023-0051242 (2023-04-19) | |
등록번호 | 10-2576320-0000 (2023-09-05) | |
DOI | http://doi.org/10.8080/1020230051242 | |
발명자 / 주소 |
|
|
출원인 / 주소 |
|
|
대리인 / 주소 |
|
|
심사청구여부 | 있음 (2023-04-19) | |
심사진행상태 | 등록결정(일반) | |
법적상태 | 등록 |
본 발명은 딥러닝 기반 생성형 AI 시스템의 학습용 데이터셋 증폭장치 및 그 방법에 관한 것으로, 외부에서 수집한 원본 문서를 표현방식을 달리한 복수 개의 학습용 데이터셋으로 증폭함으로써, 적은 양의 수집 문서로부터 대량의 학습용 데이터셋을 확보할 수 있으며, 상기 증폭한 학습용 데이터셋을 통해 딥러닝 기반 생성형 AI 모델을 학습하여 성능을 개선할 수 있는 딥러닝 기반 생성형 AI 시스템의 학습용 데이터셋 증폭장치 및 그 방법에 관한 것이다.
외부 서버로부터 문서를 수집하는 문서 수집부;상기 외부 서버로부터 수집한 각 문서별 텍스트를 추출하는 텍스트 추출부; 상기 추출한 텍스트를 통해 각 문서별 단일의 핵심 문장을 생성하는 핵심 문장 생성부; 상기 생성한 단일의 핵심 문장으로부터 요약 문장 생성을 위한 복수의 프롬프트를 생성하는 프롬프트 생성부; 상기 생성한 복수의 프롬프트를 GPT 시리즈를 포함한 언어 모델인 초거대 AI 모델에 입력하여 복수 개의 요약 문장을 생성하는 요약 문장 생성부; 상기 생성한 복수 개의 요약 문장에 대해서 통계적 유사도 측정을 수행하는 통계적
※ AI-Helper는 부적절한 답변을 할 수 있습니다.