보고서 정보
주관연구기관 |
한국과학기술정보연구원 Korea Institute of Science and Technology Information |
연구책임자 |
신동구
|
참여연구자 |
김윤정
,
김태현
,
김도균
,
김소현
,
김은경
,
박근희
,
박남규
,
박지영
,
석중호
,
신용주
,
오충식
,
유은지
,
이병희
,
이상기
,
이정현
,
이종원
,
장광선
,
정현지
,
조우승
,
김주영
,
손강렬
,
장영선
,
노지희
,
최광남
,
강남규
,
공혜수
,
김동학
,
김상국
,
김소영
,
김완종
,
김재훈
,
김정환
,
김종원
,
김중백
,
김진영
,
김혜선
,
김환민
,
박정훈
,
박진형
,
박형선
,
배수영
,
서태설
,
선충녕
,
송사광
,
송태욱
,
신성호
,
신영호
,
신재민
,
안성수
,
유수현
,
유슬기
,
윤영준
,
이미경
,
이선희
,
이승복
,
이혜림
,
임석종
,
임정선
,
임찬욱
,
정영임
,
정용일
,
조성남
,
최붕기
,
최성배
,
최원준
,
허완영
,
현미환
,
황미녕
,
황혜경
,
이지연
,
나혜인
,
이준영
,
최정우
,
Shmagun.H
|
보고서유형 | 1단계보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2022-12 |
과제시작연도 |
2022 |
주관부처 |
과학기술정보통신부 Ministry of Science and ICT |
연구관리전문기관 |
한국과학기술정보연구원 Korea Institute of Science and Technology Information |
등록번호 |
TRKO202300002675 |
과제고유번호 |
1711173845 |
사업명 |
한국과학기술정보연구원연구운영비지원(주요사업비) |
DB 구축일자 |
2023-07-20
|
키워드 |
국가R&D데이터.빅데이터.기계학습.인공지능.자연어처리.National R&D Data.Big Data.Machine Learning.Artificial Intelligence.Natural Language Processing.
|
초록
▼
□ 연구개발 목표 및 내용
◼ 최종 목표
⦁ 빅데이터 기반 지능형 R&D 정보서비스 플랫폼 구축을 통해 ScienceON, NTIS 등 KISTI 주요서비스의 R&D 정보 활용 체계 완성
◼ 전체 내용
⦁ R&D 정보처리 지능형 모델 개발 및 R&D학습데이터 구축
※ R&D 정보처리를 위한 R&D 과제 정보 요약 모델, R&D 정보 주요 키워드 추출 모델, R&D 정보 개체명 인식 모델, 의도기반 지능형 R&D 정보 검색 모델, 내용기반 R&D 과제 및 논문 간 관계 예측 모델, 연구 동향 분석을
□ 연구개발 목표 및 내용
◼ 최종 목표
⦁ 빅데이터 기반 지능형 R&D 정보서비스 플랫폼 구축을 통해 ScienceON, NTIS 등 KISTI 주요서비스의 R&D 정보 활용 체계 완성
◼ 전체 내용
⦁ R&D 정보처리 지능형 모델 개발 및 R&D학습데이터 구축
※ R&D 정보처리를 위한 R&D 과제 정보 요약 모델, R&D 정보 주요 키워드 추출 모델, R&D 정보 개체명 인식 모델, 의도기반 지능형 R&D 정보 검색 모델, 내용기반 R&D 과제 및 논문 간 관계 예측 모델, 연구 동향 분석을 위한 R&D 정보 주요 키워드 트렌드 추출 모델 등
⦁ ScienceON, NTIS 등 KISTI 주요서비스에 활용 지원
- ScienceON, NTIS 등 KISTI 주요서비스에 R&D정보 활용을 위한 R&D 정보처리 지능형 모델 및 학습데이터셋 제공
- R&D 정보처리 지능형 모델 활용 시나리오 제공
※ 연구자 생애주기별 맞춤형 서비스, 이용자 의도기반 R&D정보 검색(ODQA) 서비스, 키워드 중심 R&D 트렌드 추출 서비스, 고객 중심 맞춤 정보 추천 서비스, 이용자 관심분야별 R&D 요약 서비스 등
◼ 1단계
❏ 목표
⦁ 빅데이터 기반 지능형 R&D 정보서비스 플랫폼 구축을 통해 ScienceON, NTIS 등 KISTI 주요서비스에 R&D 정보 활용 체계 기반 구축
- R&D 과제 정보 요약 모델, 키워드 추출 모델 개발 및 활용
❏ 내용
⦁ R&D 정보처리 지능형 모델 개발 및 R&D학습데이터 구축
※ R&D 현황 파악을 위한 주요 키워드 추출 모델, 기관명 인식을 위한 개체명 인식 모델등
⦁ ScienceON, NTIS 등 KISTI 주요서비스에 활용 지원
- ScienceON, NTIS 등 KISTI 주요서비스에 R&D 정보 활용을 위한 R&D 정보처리 지능형 모델 및 학습데이터셋 제공
- R&D 정보처리 지능형 모델 활용 시나리오 제공
※ 연구자 생애주기별 맞춤형 서비스 등
◼ 2단계
❏ 목표
⦁ 빅데이터 기반 지능형 R&D 정보서비스 플랫폼 구축을 통해 ScienceON, NTIS 등 KISTI 주요서비스에 R&D 정보 활용 체계 구축
- 요약 모델, 의도기반 검색 모델 개발 및 활용
❏ 내용
⦁ R&D 정보처리 지능형 모델 개발 및 R&D학습데이터 구축
※ 과제, 논문 등의 R&D 정보 요약모델, 의도기반 지능형 R&D 정보 검색 모델 등
⦁ ScienceON, NTIS 등 KISTI 주요서비스에 활용 지원
- ScienceON, NTIS 등 KISTI 주요서비스에 R&D 정보 활용을 위한 R&D 정보처리 지능형 모델 및 학습데이터셋 제공
- R&D 정보처리 지능형 모델 활용 시나리오 제공
※ 이용자관심분야별R&D요약서비스, 이용자 의도기반 R&D정보검색(ODQA, Open-Domain Question Answering) 서비스 등
◼ 3단계
❏ 목표
⦁ 빅데이터 기반 지능형 R&D정보 서비스 플랫폼 구축을 통해 ScienceON, NTIS 등 KISTI 주요서비스에 R&D 정보 활용 체계 구축
- 내용기반 관계 예측 모델, 트랜드 추출 모델 개발 및 활용
❏ 내용
⦁ R&D 정보처리 지능형 모델 개발 및 R&D학습데이터 구축
※ 내용기반 과제 및 논문 간 관계 예측 모델, 연구동향 분석을 위한 주요 키워드 트렌드 추출 모델 등
⦁ ScienceON, NTIS 등 KISTI 주요서비스에 활용 지원
- ScienceON, NTIS 등 KISTI 주요 서비스에 R&D 정보 활용을 위한 R&D 정보처리 지능형 모델 및 학습데이터셋 제공
- R&D 정보처리 지능형 모델 활용 시나리오 제공
※ 키워드 중심 R&D 트렌드 추출 서비스, 고객 중심 맞춤 정보 추천 서비스 등
□ 연구개발성과
< 정량 성과 >
⦁ 빅데이터 기반의 R&D 정보처리 지능형 모델 개발 (연도별 1종씩 총 6종)
⦁ 빅데이터 기반의 R&D 정보처리 지능형 모델 6종의 정확도 목표 달성
※ 모델별 정확도 목표 :
· R&D 과제정보요약모델정확도45.4 (ROUGE-1 기준) 이상
· R&D 정보 주요 키워드 추출 모델 0.23 (Precision@10 기준) 이상
· R&D 정보 개체명 인식 모델 56.1(F1 기준) 이상
· 의도기반 지능형 R&D 정보 검색 모델 45.6(F1) 또는 36.9(EM) 이상
· 내용기반 R&D 과제 및 논문 간 관계 예측 모델 0.62(Hits@10 기준) 이상
· 연구동향분석을위한R&D 정보주요키워드트렌드추출모델0.23 (Precision@10 기준) 이상
< 정성 성과 >
⦁ 빅데이터 기반 지능형 R&D 정보서비스 기반 마련
□ 연구개발성과 활용계획 및 기대 효과
⦁ R&D 정보처리 지능형 모델 및 학습데이터셋 제공을 통한 ScienceON, NTIS 등 KISTI 주요서비스에 활용
⦁ 자체 지능형 R&D 정보서비스 요소기술 개발 및 모듈화를 통한 오픈사이언스 강화 및 R&D정보의 효과적인 제공에 기여
⦁ R&D 정보처리 지능형 모델 개발을 통한 국가R&D정보의 공유·융합·협력 지원
(출처 : 요약문 4p)
Abstract
▼
Ⅳ. Results
○ Quantitative achievements
- Developing a summarization model of R&D information specialized in R&D data for the first time in Korea (100% of the target 1)
· Development of a hierarchical model to summarize R&D information that combines extractive and abstractive models with few
Ⅳ. Results
○ Quantitative achievements
- Developing a summarization model of R&D information specialized in R&D data for the first time in Korea (100% of the target 1)
· Development of a hierarchical model to summarize R&D information that combines extractive and abstractive models with fewer grammatical errors and effectively compresses multiple sentences
· Completion of the development of a R&D information summarization model by reflecting user requirements in accordance with standard processes for developing artificial intelligence models such as strategy establishment, data collection/analysis, data preprocessing, modeling, modularization/distribution, etc.
- The R&D summarization model achieves Accuracy (ROUGE-1) 49.3 (108.6% performance compared to the target 45.4)
- Developing a technology keyword extraction model that helps users to catch technology trends
· Development of a technology keyword extraction model that ensures diversity of results and has high performance by considering importance of word itself.
- The technology keyword extraction mode achieves Precision@10 0.30(130% performance compared to the target 0.23)
○ Qualitative achievements
- Support the utilization of core KISTI services and digital transformation
· Obtain analysis models of R&D fields
- Support for popularization of science and technology.
· Support the general public to easily access national R&D information.
· Support for fast retrieval of science and technology information.
- Support key services utilization of KISTI
· Support for R&D information utilization services of major KISTI services such as ScienceON and NTIS.
- Support digital transformation
· Provide R&D datasets and models for machine learning in the field of science and technology.
· Provide a national data and AI-based R&D research environment.
(source : Summary 9p)
목차 Contents
- 표지 ... 1
- 제 출 문 ... 2
- 단계보고서 초록 ... 3
- 요 약 문 ... 4
- Summary ... 7
- Contents ... 11
- 목차 ... 13
- 표목차 ... 15
- 그림목차 ... 16
- 1장 연구개발과제의 개요 ... 18
- 1절 연구개발 최종 목표(2021-2026 기준) ... 18
- 2절 국내·외 기술개발 현황 ... 18
- 3절 단계별 연구개발 로드맵 ... 19
- 4절 단계별 연구개발과제 목표 및 내용 ... 20
- 1. 성과지표 및 연차별 목표 ... 20
- 2. 1단계(2021-2022) 성과지표 달성도 ... 21
- 3. 전략목표(대과제)-성과목표(중과제)-성과지표(세부과제) 성과 연계도 ... 21
- 4. 추진전략 및 협력 네트워크 ... 21
- 5. 1단계(`21 ~ `22) 대표성과 ... 22
- 2장 연구개발과제의 수행 과정 및 수행 내용 ... 23
- 1절 빅데이터 플랫폼 기반 R&D 정보처리 지능형 모델 개발 ... 23
- 1. R&D 과제 정보 요약 모델 개발(1차년도) ... 23
- 2. R&D 정보 주요 키워드 추출 모델 개발(2차년도) ... 29
- 2절 빅데이터 플랫폼 기반 R&D 정보처리 지능형 모델 정확도 ... 34
- 1. R&D 과제 정보 요약 모델 정확도 측정 및 개선 (1차년도) ... 34
- 2. R&D 키워드 추출 모델 정확도 측정 및 개선 (2차년도) ... 35
- 3절 빅데이터 기반의 R&D 정보처리 지능형 모델 개발 및 활용 전략 수립 ... 37
- 1. R&D 정보처리 지능형 모델 개발 로드맵 ... 37
- 2. 주요 키워드 추출 모델 개발을 위한 학습데이터 설계 및 환경 구축 ... 39
- 3. 개체명 인식 모델 개발을 위한 동향 조사 및 기획 ... 40
- 4. R&D 정보처리 지능형 모델 활용 시나리오 ... 44
- 3장 연구개발과제의 수행 결과 ... 50
- 1절 정성적 연구개발성과 ... 50
- 2절 정량적 연구개발성과 ... 51
- 4장 연구개발성과의 관련 분야에 대한 기여 정도 ... 58
- 5장 연구개발성과의 관리 및 활용 계획 ... 58
- 1절 연구데이터 관리계획(DMP) 추진실적 ... 59
- 6장 참고문헌 ... 60
- 끝페이지 ... 62
※ AI-Helper는 부적절한 답변을 할 수 있습니다.