최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기주관연구기관 | 한국과학기술정보연구원 Korea Institute of Science and Technology Information |
---|---|
연구책임자 | 전홍우 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2010-12 |
주관부처 | 교육과학기술부 |
사업 관리 기관 | 교육과학기술부 |
등록번호 | TRKO201100007962 |
DB 구축일자 | 2013-04-18 |
키워드 | 문장 재구성.단어 재구성.문장 인식.띄어 쓰기.PDF.XML.Sentence reconstruction.Word reconstruction.Sentence detection.word segmentation. |
○ 전체 논문(Full paper)을 이용한 다양한 의미 정보 추출의 요구 증대.
- 대부분의 전체 논문은 PDF 양식으로 공개되어 있음.
- 기존 자연어처리 연구는 대부분 초록(Abstract)만을 이용한 한정적인 연구임.
- 전체 논문 이용의 시도가 있으나 공개 되어 있는 논문수의 제한으로 자체적인 말뭉치 구축 작업 시행.
- 이 작업은 많은 시간과 노동을 필요로 하는 자연어처리 연구의 병목구간임.
○ 위의 요구를 충족시키기 위해 PDF의 XML로의 변환기 개발.
- PDF 문서 내부를 분석하여
Most public data have published using PDF (Portable Document Format), because it is not dependant upon devices, operating systems. However, PDF processing is a bottleneck because analysis of semantic information from PDF is a difficult task. Thus, there are a lot of needs to convert PDF to other str
※ AI-Helper는 부적절한 답변을 할 수 있습니다.