검색연산자 | 기능 | 검색시 예 |
---|---|---|
() | 우선순위가 가장 높은 연산자 | 예1) (나노 (기계 | machine)) |
공백 | 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 | 예1) (나노 기계) 예2) 나노 장영실 |
| | 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 | 예1) (줄기세포 | 면역) 예2) 줄기세포 | 장영실 |
! | NOT 이후에 있는 검색어가 포함된 문서는 제외 | 예1) (황금 !백금) 예2) !image |
* | 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 | 예) semi* |
"" | 따옴표 내의 구문과 완전히 일치하는 문서만 검색 | 예) "Transform and Quantization" |
본 논문은 신문기사를 추출(Extract)하는데 있어서, 신문기사의 구조적인 특징을 분석한 후, 6하원칙(5W1H)과 전문(Lead)과의 관계를 유추하여 신문기사를 효과적으로 요약하기 위한 방법과 알고리즘을 제안하였다. 본 연구에서는 먼저 신문기사에서 가장 중요한 단락인 전문에서 6하원칙의 각 구성성분을 추출하고, 본문에서는 전문에 나타난 6하원칙의 각 성분이 어떻게 재사용되며 강조되고 있는가를 파악하기 위래 제안된 방법과 알고리즘을 이용하여 중요한 문장을 추출하였다. 실험문서는 조선일보 웹사이트에서 제공하는 신문기사 100건을 대상으로 하였으며 요약율이 20%와 30%일 경우 제안한 방법의 정확률은 각각 82.4%와 74.1%로 기존의 전문기반(Lead-based)방법보다 3.6%와 6.3% 향상되었다.
원문 PDF 다운로드
원문 URL 링크
원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)
DOI 인용 스타일
"" 핵심어 질의응답