최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기주관연구기관 | 동국대학교 DongGuk University |
---|---|
연구책임자 | 이영섭 |
참여연구자 | 김하빈 , 강인경 , 동경진 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2015-11 |
주관부처 | 미래창조과학부 KA |
사업 관리 기관 | 한국과학기술정보연구원 Korea Institute of Science and Technology Information |
등록번호 | TRKO201600000569 |
DB 구축일자 | 2016-04-16 |
키워드 | 기술분류,산업분류,텍스트마이닝,자연어 처리,토픽 모델링Technology Code,Industry Code,Text Mining,Natural Language Processing,Topic Modeling |
한국산업분류(KSCI) 설명집에 대한 텍스트 크롤링 및 전처리 실시
- J열: 출판, 방송통신 및 정보서비스업에 대한 설명집 크롤링 및 전처리 실시
- C열: 제조업에 대한 설명집 크롤링 및 전처리 실시
형태소 분석을 위한 관련 분야 한글 사전 정리
형태소 분석기를 이용한 명사추출 실시
추출된 명사 목록을 이용하여 불용어 처리 등 텍스트 처리 기법을 활용한 정확도 향상
구축된 토픽과 새로 입력되는 설명(Query) 사이의 매칭 알고리즘 개발
- 텍스트 벡터 사이의 코사인 유사도 산출 방법 연구<
※ AI-Helper는 부적절한 답변을 할 수 있습니다.