최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기주관연구기관 | 동아대학교 산학협력단 Donga University |
---|---|
연구책임자 | 고영중 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2016-06 |
과제시작연도 | 2015 |
주관부처 | 미래창조과학부 Ministry of Science, ICT and Future Planning |
등록번호 | TRKO201700013770 |
과제고유번호 | 1345238110 |
사업명 | 이공학개인기초연구지원 |
DB 구축일자 | 2017-11-25 |
DOI | https://doi.org/10.23000/TRKO201700013770 |
본 연구는 여러 언어로 구성된 빅 데이터의 분석을 위한 것으로, 다음과 같이 세 가지 핵심 과제로 나누어 과제를 수행하였다.
1) 다중 언어 개체명 사전 구축 기술
- 위키피디아가 제공하는 XML 파일을 분석하여 여러 언어로 구성된 위키피디아 문서에 포함된 다양한 정보(개체명, 본문, 분류정보, 하이퍼링크, 인터위키 등)를 종류별로 파싱 및 인덱싱
- 위키피디아 문서의 분류정보를 이용하여 분류체계를 자동 생성. 각 언어별로 분류정보의 내부 특성이 다를 수 있으므로 심도 있는 분석 및 다양한 실험 수행 분류정보
※ AI-Helper는 부적절한 답변을 할 수 있습니다.