최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기주관연구기관 | 한양대학교 HanYang University |
---|---|
연구책임자 | 차재혁 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2019-06 |
과제시작연도 | 2018 |
주관부처 | 과학기술정보통신부 Ministry of Science and ICT |
등록번호 | TRKO201900020437 |
과제고유번호 | 1711070866 |
사업명 | 개인기초연구(과기정통부)(R&D) |
DB 구축일자 | 2020-04-25 |
키워드 | 웹 데이터 추출.웹 정보 추출.정보 검색.지식 공학.인공지능.기계학습.웹 컴퓨팅. |
□ 연구개요
웹 기술의 발전으로 최신 웹페이지는 서로 다른 역할과 내용을 가진 영역의 집합으로 구성되면서 그 중 웹페이지가 담고 있는 콘텐트를 가진 영역만을 추출해내는 것이 더욱 중요해졌다. 주요 콘텐츠 추출은 웹페이지를 구성하는 콘텐트를 분리하고 그 중 웹페이지에서 의미론적으로 가장 중요한 정보를 담고 있는 영역만을 추출해내는 것이다. 본 연구는 시대적, 지역적 웹 환경에 영향을 많이 받는 기존 웹 콘텐트 추출 기술의 결점을 개선하여 오래된 국내 웹 서비스, 아울러 최신 SAP 웹페이지 형태까지 다양한 웹 환경에 대응하는 메
※ AI-Helper는 부적절한 답변을 할 수 있습니다.