[논문]이용자 생성 도서정보 태그에 기반한 소설 검색의 패싯 유형 개발

심지영

doi:10.3743/kosim.2020.37.2.225

이용자 생성 도서정보 태그에 기반한 소설 검색의 패싯 유형 개발
Developing Facets for Fiction Retrieval Based on User-generated Book Tags 원문보기

정보관리학회지 = Journal of the Korean society for information management, v.37 no.2, 2020년, pp.225 - 249

심지영

초록
AI-Helper

본 연구는 소설 검색 환경을 개선하기 위해, 도서태그로부터 소설 이용자가 소설 탐색 상황에서 요구하는 다양한 패싯 요소를 식별하고 체계화하는 것을 목적으로 한다. 소설의 기본 패싯 체계를 랑가나단의 PMEST 기본 패싯에 기반하여, 1) 소설 자료를 형성하는 주체, 2) 소설을 구성하는 내용적, 외형적 성질, 3) 독자가 책과 상호작용하는 행위, 4) 소설 및 독서활동과 관련된 공간 정보, 5) 소설 및 독서활동과 관련된 시간 정보로 정의하고, 소설 7,174건에 부여된 약 31만 건의 태그 중 핵심 태그 3,730건을 선별하여 내용분석하였다. 그 결과, 소설 패싯의 상위범주 25개를 중심으로 다양한 속성을 체계화하였다. 본 연구의 결과는 향후 도서관 OPAC이나 소설 DB에 패싯 내비게이션 형태로 적용될 수 있을 것으로 기대된다.

Abstract ▼ AI-Helper

The purpose of this study is to identify and systematize various facet elements required by users in fiction search situations from book tags to improve the fiction search environment. Based on the Ranganathan's PMEST formula, the basic facet system of the fiction was defined as 1) the personality that forms the fiction material, 2) the content and external characteristics that compose the fiction, 3) the reader interaction with books, 4) spatial information related to fiction and reading activities, and 5) time information related to fiction and reading activities. Out of approximately 310,000 tags assigned to 7,174 fiction, 3,730 core tags were selected and content-analyzed. As a result, various attributes were systematized around the top 25 categories of the fiction facets. The results of this study can be applied to facet navigation of OPAC and fiction DB in the future.

주제어

표/그림 (13)

표 <표 1> 소설의 기본 패싯 체계 정의
그림 <그림 1> LibraryThing의 Work ID 286489에 해당하는 소설에 관한 정보 및 도서태그 데이터를 제공하는 웹 페이지 화면
그림 <그림 2> 고유 태그의 분포 및 컷오프를 통한 핵심 도서태그 선정
표 <표 2> Stanford NER을 통해 식별된 도서태그의 개체명 유형 및 분포(N=3,730)
그림 <그림 3> 구글 검색을 통한 캐릭터 정보 수집 결과 화면
그림 <그림 4> 위키피디아를 통한 장르 정보 수집 결과 화면
표 <표 3> 도서태그로부터 식별된 소설 검색의 패싯 체계의 상위범주 및 분포(N=3,730)*
표 <표 4> 소설의 재료(M) 패싯의 상하위 범주 및 내용(n=2,489)
표 <표 5> 소설의 에너지(E) 패싯의 상하위 범주 및 내용(n=908)
표 <표 6> 소설의 장소(S) 패싯의 상하위 범주 및 내용(n=695)
표 <표 7> 소설의 장소(T) 패싯의 상하위 범주 및 내용(n=414)
그림 <그림 5> Fiction Core Collection에서 제공하는 소설에 대한 서지정보 예시
표 <표 8> 소설에 대한 도서태그와 소설검색 전문 DB의 키워드 Top 100 비교*

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

한편, 대량의 도서태그 컬렉션으로부터 용어의 일관성을 유지하고 각 태그의 의미를 보다 효율적으로 분류하기 위해, 특정 속성(예, 인물, 지리적 위치, 시간, 조직, 장소 등)에 대응되는 태그를 자동으로 감지하고 분류할 수 있는 개체명 인식(Named-Entity Recognition, 이하 NER) 기법 적용을 시도한다. 궁극적으로 소설 독자들이 자주 사용하는 전형적인 요구 유형을 식별하고, 검색에 주로 관여하는 요소를 파악하여 체계적으로 제공하는 것을 목적으로 한다.
본 연구는 도서검색 환경에서 이용자 요구 맥락을 반영한 지적 접근점을 제공하기 위해, 도서에 대한 이용자의 다양한 요구가 표현된 도서 태그를 기반으로 소설 고유의 ‘패싯(facet)’ 유형을 개발하는 것을 목표로 한다.
본 연구는 소설 검색 환경을 개선하기 위해, 도서태그로부터 소설 이용자가 소설 탐색 상황 에서 요구하는 다양한 패싯 요소를 식별하고 체계화하는 것을 목적으로 한다. 특히, 본 연구 에서는 자료의 속성을 표현하고, 구조화하는 데 효과적인 랑가나단의 패싯 개념을 소설의 특성과 관련지어 해석하여 도서태그 분석에 적용하였다.
본 연구는 소설검색에서의 이용자들의 요구를 도서태그 데이터를 통해 식별하기 위해, 소설 관련 도서태그 수집을 기본으로 한다. 다수의 독자를 지닌 소설을 선별하는 한편, 도서 태깅 활동이 활발한 영어권 사회적 목록 플랫폼을 대상으로 하기 위해, 소설 저작의 표집틀 (sampling frame)을 영미권 고전과 현대 소설의 정선된 목록인 Fiction Core Collection(Wilson, 2016)을 대상으로 하였다.
본 연구는 소수 이용자 샘플로 인한 한계를 해결하고, 색인자의 주관을 가능한 배제하기 위해, 다수의 이용자 관점이 자연스럽게 반영된 대량의 도서태그 데이터를 사용한다. 또한, 태그 용어가 지닌 모호성을 해결하고, 이용자의 이용 맥락을 추출하기 위해 자료의 속성을 표현하는 데 효과적이며(Broughton, 2006), 주제 접근성을 높이는 데 유용한 것으로 여겨져 온(Chung, 2014) 패싯 분석 방법을 적용하여 이용자 태그의 의미를 식별하고 구조화한다.
태그 내에 서의 관계를 설정해주어 태그의 의미를 명확하게 해주는 방법(예, 김동숙, 정연경, 2010)과 통제어휘 체계를 사용하여 태그의 의미적 제어를 하는 방법(예, 이승민, 2011) 등이 제안된 바 있다. 본 연구는 자료 고유의 특성과 이용자와 관련된 맥락 정보 표현에 유용한 전자의 방식을 기본으로 하되, 대량의 도서태그 컬렉션 으로부터 용어의 일관성을 유지하고 각 태그의 의미를 보다 효율적으로 분류하기 위해, 특정 속성(예, 인물, 지리적 위치, 시간, 조직, 장소 등)에 대응되는 태그를 자동으로 감지하고 분류할 수 있는 NER 기법을 적용하여 후자의 방식도 절충하는 형태로 진행하고자 한다.
본 연구에서는 7,174개의 소설에 부여된 전체 31만여 건에 달하는 자연어 상태의 도서태그 데이터를 의미 단위로 결합하고, 방대한 태그 집합 내에서 상대적으로 많은 소설 이용자 들에게 부여받은 핵심 도서태그를 선정하는 작업을 수행하여 작업의 효율성을 꾀하였다. 먼저 자연어 상태의 도서태그 데이터들을 의미 단위로 결합하기 위해, 자연어 처리에서 많이 사용하는 두 가지 자연어 처리 기법인 대소문자 통일 (case folding)과 원형복원(lemmatization)을 사용하였다.
본 연구에서는 기존의 소설 색인연구에서 주목해온 소설 콘텐츠와 이용자의 요구에 기반한 소설 고유의 요소 식별에 주목한다. 특히, 웹 2.
본 연구에서는 랑가나단의 PMEST 패싯을 인물, 사건, 배경을 중심으로 서사구조를 지닌 소설의 속성에 잘 부합한다고 보고, 소설 검색의 패싯 유형을 개발하는 데 기본 구조로 삼았 다( 참고).
본 연구에서는 방대한 태그 데이터를 일관되고 신속하게 처리하기 위해, 전체 태그 데이터 집합에서 핵심 태그 집합을 선별하였으며, 소설 검색의 패싯 유형을 구분하는 내용분석을 하기 이전에, NER 기법을 적용하여 자동으로 유사한 패턴이 발견되는 태그들을 초벌 분류하 였다. 이러한 방식은 향후 유사한 연구에도 적용될 수 있으리라 본다.
이는 ‘직업’ 패싯이 유달리 호주 문화권의 이용자들에 의해 탐색 접근점으로써 의미가 있음을 추정해 볼 수 있는 내용으로 검색 상황에서 이용자 관점을 분석하고 적용할 필요성을 역설하는 예이다. 이에 본 연구에서는 많은 이용자로부터부터 선택 받은 용어를 소설의 구조적인 속성을 추출하는데 사용하여 현상에 기반한 지적 접근점을 구현하려는 노력을 하였다.
본 연구는 도서검색 환경에서 이용자 요구 맥락을 반영한 지적 접근점을 제공하기 위해, 도서에 대한 이용자의 다양한 요구가 표현된 도서 태그를 기반으로 소설 고유의 ‘패싯(facet)’ 유형을 개발하는 것을 목표로 한다. 특히, 도서태그 관련 연구의 주요 대상으로 여겨져 왔으며, 공공도서관의 이용요구에서도 높은 비중을 차지하고 있는 소설 장르로 한정하여, 소설검색에 특화된 패싯 유형을 개발하고자 한다. 웹 정보 검색 환경에서 지적 접근점을 제공하는 데 유용한 개념으로 주목받아 온 랑가나단의 PMEST 기본 패싯을 기반으로, 내용분석을 통해 소설 고유의 패싯 속성을 추출하고 의미 관계를 체계화하고자 한다.
본 연구에서는 기존의 소설 색인연구에서 주목해온 소설 콘텐츠와 이용자의 요구에 기반한 소설 고유의 요소 식별에 주목한다. 특히, 웹 2.0 환경 이후 등장한 도서태그 데이터 분석 연구에서 한 단계 더 나아가, 단순한 요소 식별이 아닌 요소 간의 관계를 체계화하는 데 초점을 두고자 한다.

제안 방법

‘문예 사조’의 경우, 도서 자체가 지니는 성질로 해석하여 재료(M) 패싯으로 간주할 수도 있으나, 본 연구에서는 문예 사조가 시대적인 사상의 흐름을 반영한다는 측면에 방점을 두고, 시간(T) 패싯으로 해석하여 분석하였다.
도서태그 데이터 수집은 도서태그 관련 선행 연구에서 널리 사용되어 온 사회적 목록 서비스인 LibraryThing으로부터 하였다. 7,277건의 소설 데이터가 LibraryThing 내에 존재하는지를 식별하기 위해, EBSCOhost에서 수집한 각 소설의 서지정보를 이용하여 검색을 수행하였다. 검색에서 먼저 사용한 질의는 도서의 고유식별기호인 ISBN이며, ISBN 정보가 없는 저작들(1,449건, 19.
본 연구에서는 이용자가 생성한 도서태그를 기반으로 하여 소설 이용자의 요구를 분석하고, 소설 검색 환경에서 활용할 수 있는 의미 있는 패싯 유형을 파악하였다. Fiction Core Collection에 수록된 소설 7,174건에 대해 이용자가 부여한 도서태그를 LibraryThing으로부터 수집하고, 수집된 도서태그 약 31만 개 중 핵심 도서태그 3,730개를 대상으로 NER 기법과 내용분석을 통해 소설 검색의 패싯 체계를 도출하였다. 패싯 구조는 랑가나단의 PMEST 기본 패싯을 토대로, 본 연구에서 정의한 기본 패싯을 토대로 하였다(<표 1> 참고).
각 도서태그는 Stanford NER에서 정의한 개체명 유형에 자동으로 할당됨으로써 대량의 도서태 그로부터 초벌 분류의 기능을 수행하였다.
본 연구에서는 랑가나단의 PMEST 패싯을 인물, 사건, 배경을 중심으로 서사구조를 지닌 소설의 속성에 잘 부합한다고 보고, 소설 검색의 패싯 유형을 개발하는 데 기본 구조로 삼았 다(<표 1> 참고). 개체(P) 패싯을 소설 자료를 형성하는 주체로 해석하여, 소설 타이틀 요소로 간주하였으며, 재료(M) 패싯의 경우, 소설을 구성하는 내용적 성질(예, 저자, 주제, 언어, 장르, 등장인물 등)과 매체 형식 등의 외형적 성질로 해석하였다. 에너지(E) 패싯은 독자가 소설과 상호작용하는 행위와 관련된 패싯으로 독자 반응, 독자 리뷰, 대상연령 등의 요소로 해석하였고, 공간(S) 패싯은 소설의 공간적 배경과 독서활동과 관련된 공간 정보 속성을 내포하는 패싯으로, 시간(T) 패싯은 소설의 시간적 배경, 독서활동과 관련된 시간 정보 속성을 의미하는 패싯으로 규정하였다.
본 연구의 분석 대상인 소설에 대한 핵심 도서태그 3,730개의 초벌 분류 결과(<표 2> 참고) 를 바탕으로, 내용분석을 수행하였다. 내용분석 과정은 코딩 체계(coding scheme)를 개발하고, 코더간 신뢰도 검증(inter-coder reliability)을 수행하고, 전체 데이터를 대상으로 최종 확립된 코딩 체계를 적용하는 방식으로 이루어졌다 (Flick, 2019). 코딩 체계 개발은 Ranganathan (1967)의 PMEST 기본 패싯을 구조로 하는 한편, Adkins와 Bossaller(2007)의 연구에서 온라인 서점과 공공도서관 OPAC, 독자자문 데이 터베이스로부터 식별된 소설의 접근점 내용을 참고하였다(<표 1> 참고).
다음으로 유사 개념들을 통제한 고유 태그들을 대상으로, 장서 빈도의 80%를 커버하는 상위 순위의 도서태그들을 핵심 도서태그로 선정하였다. 본 연구에서 식별된 고유 태그 309,313개는 <그림 2>와 같이 빈도와 순위에 로그 스케일을 적용했을 때 회귀 계수가 -1에 근접한 -1.
단, 여기서 ‘대상 독자’ 나 ‘독서 수준’은 도서 자체가 지니는 성질로 해석하여 재료(M) 패싯으로 간주할 수도 있으나, 본 연구에서는 해당 속성이 도서 자체에 초점이 있는 것이 아니라, 이용자와 연관되어 해석 되었다는 점에 방점을 두고, 에너지(E) 패싯으로 해석하여 분석하였다.
데이터 분석은 핵심 도서태그 데이터로 선정된 3,730개의 도서태그를 대상으로 NER 기법을 사용하여 도서태그들의 개체명 유형을 자동으로 식별하는 초벌 분류를 먼저 수행하였다. 이는 대량의 도서태그 컬렉션으로부터 특정 속성에 대응되는 태그를 자동으로 감지하여 보다 효율적으로 분류하기 위함이다.
이 가운데, 태그가 전혀 할당되지 않은 저작들(16 건)은 제외하였으며, 최종적으로 7,174개 소설 로부터 총 316,844개 단어(구) 유형의 도서태그 데이터를 수집하였다. 도서태그 수집 과정은 Python 프로그래밍 언어를 통해 자동화된 방법으로 수행하였다.
특히, 본 연구 에서는 자료의 속성을 표현하고, 구조화하는 데 효과적인 랑가나단의 패싯 개념을 소설의 특성과 관련지어 해석하여 도서태그 분석에 적용하였다. 도서태그를 대상으로 소설 고유의 요소 (소설의 3요소, 소설 구성의 3요소)를 패싯 유형으로 규정한 연구(김동숙, 정연경, 2010)가 기존에 정의된 요소를 패싯으로 사용하였다면, 본 연구에서는 랑가나단의 PMEST 기본 패싯 체계를 응용하여 소설 자료의 이용자가 제시한 용어들에 기반한 패싯 유형을 개발하였다. 이처럼 현상에 기반한 방법은 이용자의 독특한 맥락을 발견하는 데 유용할 것이라 여겨진다.
코더간 신뢰도 검증은 내용분석의 일관성과 타당성을 확보하기 위해, 전체 도서태그 데이 터(N=3,730)의 10%에 해당하는 370개 태그 를 계통 표집(systematic sampling)하여, 제2 코더에 의한 분석을 수행하였다. 두 명의 코더에 의한 분석은 홀스티 공식(Holsti, 1969, p.137)을 사용하여 코더간 일치도가 80% 이상 도달할 때까지 반복적으로 재수행하며, 코딩 체계를 수립하였다. 최종적으로 두 명의 코더간 일치도는 89.
본 연구를 통해 파악된 소설 검색의 패싯 요소는 전통적인 소설 색인에서 드러나지 않았던 요소는 물론, 기존에 색인 요소를 보다 세분화 하는 요소들을 식별해 내었다. 특히 소설 자료와 독자와의 상호작용 행위와 관련되는 에너지 (E) 패싯의 요소가 독서활동 요소(예, 도서 입수 경로, 독서 상태, 독자 반응, 독자 리뷰, 독서 프로그램 등)와 독서활동에 유용한 정보 요소 (예, 추천도서리스트, 문학상, 독서 수준 등)로 식별되었고, 소설을 구성하는 내용적, 외형적 성질을 의미하는 재료(M) 패싯과 관련해서도 이용자들이 소설에 대해 매우 세부적으로 접근하는 양상을 파악할 수 있었다.
본 연구에서는 이용자가 생성한 도서태그를 기반으로 하여 소설 이용자의 요구를 분석하고, 소설 검색 환경에서 활용할 수 있는 의미 있는 패싯 유형을 파악하였다. Fiction Core Collection에 수록된 소설 7,174건에 대해 이용자가 부여한 도서태그를 LibraryThing으로부터 수집하고, 수집된 도서태그 약 31만 개 중 핵심 도서태그 3,730개를 대상으로 NER 기법과 내용분석을 통해 소설 검색의 패싯 체계를 도출하였다.
본 연구의 분석 대상인 소설에 대한 핵심 도서태그 3,730개의 초벌 분류 결과( 참고) 를 바탕으로, 내용분석을 수행하였다.
소설에 대해 일반 이용자들이 부여한 도서태 그가 소설 정보를 전문적으로 제공하는 검색 서비스에서 제공하는 요소들과 어떠한 차별점을 드러내는가는 본 연구에서 소설 저작의 표집틀로 사용한 Fiction Core Collection의 서지정 보 요소와의 비교를 통해 이루어졌다. Fiction Core Collection과 같은 독자자문 DB는 기존에 도서관 OPAC과 온라인 서점에서 제공하는 요소들을 포함하고 있을 뿐만 아니라, 상대적으로 상세하고 다양한 소설 접근점을 제공하고 있는 것으로 드러났기 때문에(Adkins & Bossaller, 2007), 비교 대상으로 의미 있다고 여겼다.
개체(P) 패싯을 소설 자료를 형성하는 주체로 해석하여, 소설 타이틀 요소로 간주하였으며, 재료(M) 패싯의 경우, 소설을 구성하는 내용적 성질(예, 저자, 주제, 언어, 장르, 등장인물 등)과 매체 형식 등의 외형적 성질로 해석하였다. 에너지(E) 패싯은 독자가 소설과 상호작용하는 행위와 관련된 패싯으로 독자 반응, 독자 리뷰, 대상연령 등의 요소로 해석하였고, 공간(S) 패싯은 소설의 공간적 배경과 독서활동과 관련된 공간 정보 속성을 내포하는 패싯으로, 시간(T) 패싯은 소설의 시간적 배경, 독서활동과 관련된 시간 정보 속성을 의미하는 패싯으로 규정하였다. 한편, 소설의 패싯 요소를 추출하는 데 있어, 온라인 서점과 공공도서관 OPAC, 독자자문 데이터베이스로부터 소설 접근점을 식별한 Adkins와 Bossaller (2007)의 연구도 참고하였다.
특히, 도서태그 관련 연구의 주요 대상으로 여겨져 왔으며, 공공도서관의 이용요구에서도 높은 비중을 차지하고 있는 소설 장르로 한정하여, 소설검색에 특화된 패싯 유형을 개발하고자 한다. 웹 정보 검색 환경에서 지적 접근점을 제공하는 데 유용한 개념으로 주목받아 온 랑가나단의 PMEST 기본 패싯을 기반으로, 내용분석을 통해 소설 고유의 패싯 속성을 추출하고 의미 관계를 체계화하고자 한다. 한편, 대량의 도서태그 컬렉션으로부터 용어의 일관성을 유지하고 각 태그의 의미를 보다 효율적으로 분류하기 위해, 특정 속성(예, 인물, 지리적 위치, 시간, 조직, 장소 등)에 대응되는 태그를 자동으로 감지하고 분류할 수 있는 개체명 인식(Named-Entity Recognition, 이하 NER) 기법 적용을 시도한다.
코더간 신뢰도 검증은 내용분석의 일관성과 타당성을 확보하기 위해, 전체 도서태그 데이 터(N=3,730)의 10%에 해당하는 370개 태그 를 계통 표집(systematic sampling)하여, 제2 코더에 의한 분석을 수행하였다. 두 명의 코더에 의한 분석은 홀스티 공식(Holsti, 1969, p.
본 연구는 소설 검색 환경을 개선하기 위해, 도서태그로부터 소설 이용자가 소설 탐색 상황 에서 요구하는 다양한 패싯 요소를 식별하고 체계화하는 것을 목적으로 한다. 특히, 본 연구 에서는 자료의 속성을 표현하고, 구조화하는 데 효과적인 랑가나단의 패싯 개념을 소설의 특성과 관련지어 해석하여 도서태그 분석에 적용하였다. 도서태그를 대상으로 소설 고유의 요소 (소설의 3요소, 소설 구성의 3요소)를 패싯 유형으로 규정한 연구(김동숙, 정연경, 2010)가 기존에 정의된 요소를 패싯으로 사용하였다면, 본 연구에서는 랑가나단의 PMEST 기본 패싯 체계를 응용하여 소설 자료의 이용자가 제시한 용어들에 기반한 패싯 유형을 개발하였다.
패싯 구조는 랑가나단의 PMEST 기본 패싯을 토대로, 본 연구에서 정의한 기본 패싯을 토대로 하였다( 참고).
웹 정보 검색 환경에서 지적 접근점을 제공하는 데 유용한 개념으로 주목받아 온 랑가나단의 PMEST 기본 패싯을 기반으로, 내용분석을 통해 소설 고유의 패싯 속성을 추출하고 의미 관계를 체계화하고자 한다. 한편, 대량의 도서태그 컬렉션으로부터 용어의 일관성을 유지하고 각 태그의 의미를 보다 효율적으로 분류하기 위해, 특정 속성(예, 인물, 지리적 위치, 시간, 조직, 장소 등)에 대응되는 태그를 자동으로 감지하고 분류할 수 있는 개체명 인식(Named-Entity Recognition, 이하 NER) 기법 적용을 시도한다. 궁극적으로 소설 독자들이 자주 사용하는 전형적인 요구 유형을 식별하고, 검색에 주로 관여하는 요소를 파악하여 체계적으로 제공하는 것을 목적으로 한다.
한편, 본 연구는 소설의 서지정보로부터 소설의 제목, 저자, 출판사 사전을 직접 구성하고, 각 개체 유형에 대한 매칭 규칙을 마련하여 소설과 연관된 개체명을 인식하였다. 소설의 서지정보로부터 소설과 연관된 개체명(제목, 저자, 출판사)과 관련된 사전을 직접 구성하여 개체명을 인식한 결과, 저자로 인식된 태그 수는 88개, 제목으로 인식된 태그 수는 64개, 출판사로 인식된 태그 수는 19개로 각각 나타났다.
핵심 도서태그 데이터(N=3,370)에 대한 코딩은 총 3회에 걸쳐 이루어졌으며, 두 개 이상의 개념이 존재하는 경우 중복 코딩을 허용하였다.대량의 데이터를 대상으로 일관성을 확보하고, 코딩 후 결과 데이터를 손쉽게 처리하기 위해 질적 내용분석 소프트웨어인 ATLAS.

대상 데이터

다수의 독자를 지닌 소설을 선별하는 한편, 도서 태깅 활동이 활발한 영어권 사회적 목록 플랫폼을 대상으로 하기 위해, 소설 저작의 표집틀 (sampling frame)을 영미권 고전과 현대 소설의 정선된 목록인 Fiction Core Collection(Wilson, 2016)을 대상으로 하였다. Fiction Core Collection (18판, 2016)에 포함된 소설 목록 및 서지정보(예, 제목, 저자, 출판사, 키워드, ISBN)를 EBSCOhost 를 통해 2017년 3월 수집하였으며, 총 7,277건의 소설을 샘플로 선정하였다. 각 소설의 서지 정보 가운데 제목과 ISBN 정보는 도서태그 데이터 수집 과정에서 샘플 도서를 식별하기 위함이며, 저자와 출판사 정보는 데이터 분석 과정에서 초기 분류에 필요한 전거 사전을 구성하기 위한 용도로 수집되었다.
Library Thing에서 식별된 샘플 소설의 도서태그 데이터는 각 저작의 고유 ID(의 URL을 구성하는 숫자 286,489에 해당)를 포함한 URL 로 접근하여 수집하였다( 참고).
대소문자 통일은 Python 프로그래밍 언어로 일괄 변환 하였고, 원형복원은 Stanford CoreNLP toolkit (Manning, Surdeanu, Bauer, Finkel, Bethard, & McClosky, 2014)을 사용하여 처리하였다. 그결과, 총 309,313개의 고유 태그를 식별하였다.
본 연구는 소설검색에서의 이용자들의 요구를 도서태그 데이터를 통해 식별하기 위해, 소설 관련 도서태그 수집을 기본으로 한다. 다수의 독자를 지닌 소설을 선별하는 한편, 도서 태깅 활동이 활발한 영어권 사회적 목록 플랫폼을 대상으로 하기 위해, 소설 저작의 표집틀 (sampling frame)을 영미권 고전과 현대 소설의 정선된 목록인 Fiction Core Collection(Wilson, 2016)을 대상으로 하였다. Fiction Core Collection (18판, 2016)에 포함된 소설 목록 및 서지정보(예, 제목, 저자, 출판사, 키워드, ISBN)를 EBSCOhost 를 통해 2017년 3월 수집하였으며, 총 7,277건의 소설을 샘플로 선정하였다.
도서태그 데이터 수집은 도서태그 관련 선행 연구에서 널리 사용되어 온 사회적 목록 서비스인 LibraryThing으로부터 하였다. 7,277건의 소설 데이터가 LibraryThing 내에 존재하는지를 식별하기 위해, EBSCOhost에서 수집한 각 소설의 서지정보를 이용하여 검색을 수행하였다.
Library Thing에서 식별된 샘플 소설의 도서태그 데이터는 각 저작의 고유 ID(<그림 1>의 URL을 구성하는 숫자 286,489에 해당)를 포함한 URL 로 접근하여 수집하였다(<그림 1> 참고). 이 가운데, 태그가 전혀 할당되지 않은 저작들(16 건)은 제외하였으며, 최종적으로 7,174개 소설 로부터 총 316,844개 단어(구) 유형의 도서태그 데이터를 수집하였다. 도서태그 수집 과정은 Python 프로그래밍 언어를 통해 자동화된 방법으로 수행하였다.
이러한 연구들은 소설 이용자의 검색 질의를 기반으로 정보요구를 분석하였으며, 이용자가 OPAC 등정보검색 시스템에 입력한 내용(Pejtersen & Austin, 1983, 1984; Solomon, 1997; Yu & O'Brien, 1997)이나 사서가 이용자의 정보요구를 파악하기 위한 면담 내용(Pejtersen, 1980) 등을 분석대상으로 한다.
0 환경의 다양한 도서정보 서비스 플랫폼에서 이용자가 색인 작성에 참여한 태그 데이터가 활발히 생성됨에 따라 다양한 형태로 이루어져 왔다. 이용자 태그는 이용자의 자연스러운 행동이 반영된 데이터로 도서관 OPAC, 사회적 목록 서비 스, 온라인 서점 등을 통해 이용자가 소설 이용과 관련하여 제출한 정보가 분석대상이 된다. 다수의 도서태그 분석 연구들이 이용자와 소설 자료의 상호작용 과정에 초점을 맞춰 소설 독자가 도서에 대해 표현하는 다양한 요소들이 존재하고 있음을 파악하였다.
핵심 도서태그 데이터 3,730개의 도서태그중 Stanford NER을 통해 개체명 유형이 식별된 태그 수는 1,496개로 전체의 40.1%에 해당 하며, 총 20개 유형의 개체명이 인식되었다 ( 참고).

데이터처리

핵심 도서태그 데이터(N=3,370)에 대한 코딩은 총 3회에 걸쳐 이루어졌으며, 두 개 이상의 개념이 존재하는 경우 중복 코딩을 허용하였다.대량의 데이터를 대상으로 일관성을 확보하고, 코딩 후 결과 데이터를 손쉽게 처리하기 위해 질적 내용분석 소프트웨어인 ATLAS.ti 7.5.4 를 이용하였다. 한편, 내용분석 과정에서 태그명으로 정보를 유추하기 힘든 경우, 구글 검색을 통해 위키피디아 정보 등 부가적인 정보를 참고하였다(<그림 3>과 <그림 4> 참고).
한편, 대량의 태그 데이터의 의미를 효율적으로 식별하고 일관적으로 분류하기 위해, NER 기법을 사용하여 자동으로 초벌 분류한다(Nadeau & Sekine, 2007). 또한, 기계학습만으로 감별되지 않는 의미구조를 파악하기 위해 내용분석을 수행하고, 내용분석 결과는 코더간 신뢰도 검증을 통해 검증한다.

이론/모형

대소문자 통일은 Python 프로그래밍 언어로 일괄 변환 하였고, 원형복원은 Stanford CoreNLP toolkit (Manning, Surdeanu, Bauer, Finkel, Bethard, & McClosky, 2014)을 사용하여 처리하였다.
본 연구에서는 7,174개의 소설에 부여된 전체 31만여 건에 달하는 자연어 상태의 도서태그 데이터를 의미 단위로 결합하고, 방대한 태그 집합 내에서 상대적으로 많은 소설 이용자 들에게 부여받은 핵심 도서태그를 선정하는 작업을 수행하여 작업의 효율성을 꾀하였다. 먼저 자연어 상태의 도서태그 데이터들을 의미 단위로 결합하기 위해, 자연어 처리에서 많이 사용하는 두 가지 자연어 처리 기법인 대소문자 통일 (case folding)과 원형복원(lemmatization)을 사용하였다. 전자는 대문자와 소문자로 분리된 도서 태그들(예, ‘fiction’, ‘Fiction’)을 하나의 표제어로 결합하는 것이고, 후자는 동일 개념이지만, 다양한 활용형을 가진 도서태그를 하나의 표제어로 묶어주는 방식이다.
코딩 체계 개발은 Ranganathan (1967)의 PMEST 기본 패싯을 구조로 하는 한편, Adkins와 Bossaller(2007)의 연구에서 온라인 서점과 공공도서관 OPAC, 독자자문 데이 터베이스로부터 식별된 소설의 접근점 내용을 참고하였다( 참고).
에너지(E) 패싯은 독자가 소설과 상호작용하는 행위와 관련된 패싯으로 독자 반응, 독자 리뷰, 대상연령 등의 요소로 해석하였고, 공간(S) 패싯은 소설의 공간적 배경과 독서활동과 관련된 공간 정보 속성을 내포하는 패싯으로, 시간(T) 패싯은 소설의 시간적 배경, 독서활동과 관련된 시간 정보 속성을 의미하는 패싯으로 규정하였다. 한편, 소설의 패싯 요소를 추출하는 데 있어, 온라인 서점과 공공도서관 OPAC, 독자자문 데이터베이스로부터 소설 접근점을 식별한 Adkins와 Bossaller (2007)의 연구도 참고하였다.

성능/효과

또한, 해당 소설이 다양한 포맷으로 존재하는 경우(예, 영화 또는 TV로 각색된 경우 등)에 대한 정보를 소설 이용자들이 주목하고 있는 것으로 드러났으며, 독자 개인의 독서 상태(예, Already read, to-read, Not Started 등)나 언제 읽었는지(예, read in 2002)와 같은 맥락 정보도 독서 활동 속성과 관련하여 비중 있게 나타났다. 그외, 소설을 읽으면서 느꼈던 감상(독자 반응), 읽고 난 후의 평가(독자 리뷰), 독서를 원활하게 하기 위한 다양한 활동 관련 속성(예, 개인 독서 리스트, 독서 프로그램, 독서토론 동호회)도 소설과 관련하여 이용자들이 의미있게 고려하는 것으로 드러났다. 한편, 추천도서 리스트, 문학상, 대상 독자, 독서 수준, 전문가 리뷰와 같은 독서활동에 유용한 다양한 정보와 관련된 속성도 드러났다.
다음으로, 독자와 소설과의 상호작용 행위에 초점이 맞춰진 에너지 패싯(E)은 독서활동과 독서활동에 유용한 정보로 드러났다( 참고).
83에 해당 하는 분류 성능을 보여주었다. 단, 숫자, 지리, 날짜, URL 등 범위가 명확한 범주의 개체명은 높은 성능을 보인 반면, 통화의 경우, #, $ 기호가 들어간 경우를 통화로 인식하여, 매우 낮은 성능(평균 F1 척도 0.33)을 보였다.
예를 들면, 해당 책을 아마존 서점에서 구매했다거나(purchased from Amazon), 도서관으로부터 대출했다는 것(borrowed from library)이 이러한 속성에 해당하는 내용이다. 또한, 해당 소설이 다양한 포맷으로 존재하는 경우(예, 영화 또는 TV로 각색된 경우 등)에 대한 정보를 소설 이용자들이 주목하고 있는 것으로 드러났으며, 독자 개인의 독서 상태(예, Already read, to-read, Not Started 등)나 언제 읽었는지(예, read in 2002)와 같은 맥락 정보도 독서 활동 속성과 관련하여 비중 있게 나타났다. 그외, 소설을 읽으면서 느꼈던 감상(독자 반응), 읽고 난 후의 평가(독자 리뷰), 독서를 원활하게 하기 위한 다양한 활동 관련 속성(예, 개인 독서 리스트, 독서 프로그램, 독서토론 동호회)도 소설과 관련하여 이용자들이 의미있게 고려하는 것으로 드러났다.
본 연구에서 식별된 고유 태그 309,313개는 와 같이 빈도와 순위에 로그 스케일을 적용했을 때 회귀 계수가 -1에 근접한 -1.1로 Zipf 법칙의 분포를 따르며, 전체 빈도가 소수의 고빈도 태그에 집중되는 것으로 드러났다.
본 연구에서는 Stanford NER에서 카테고리의 정의 자체가 포괄적이고 모호한 기타(MISC) 를 제외하고, 분류 성능을 평가한 결과, 마이크로 평균 정확률은 0.88, 마이크로 평균 재현율은 0.79, 마이크로 평균 F1 척도는 0.83에 해당 하는 분류 성능을 보여주었다.
소설의 서지정보로부터 소설과 연관된 개체명(제목, 저자, 출판사)과 관련된 사전을 직접 구성하여 개체명을 인식한 결과, 저자로 인식된 태그 수는 88개, 제목으로 인식된 태그 수는 64개, 출판사로 인식된 태그 수는 19개로 각각 나타났다. 사전을 통한 NER 결과를 Stanford NER 결과와 통합한 결과, 최종적으로 개체명으로 인식된 태그의 개수는 1,541개로, 핵심 도서태그(N=3,730) 가운데 NER을 통해 자동으로 초벌 분류된 비율은 41.3%로 드러났다.
소설 7,174건에 대해 사회적 목록 서비스인 LibraryThing에서 식별한 도서태그와 소설 검색 전문 DB(이하 소설 DB)인 Fiction Core Collection에서 추출한 키워드 상위 100개를 비교해 본 결과, 소설 DB의 키워드의 경우, 주로 소설의 주제와 장르와 관련된 내용이 집중되는 것을 볼 수 있다. 그에 반해, 도서태그는 이용자의 독서활동과 관련된 내용이 다수 포함되어 있었다.
특히, 독서활동 과정에서 수반되는 독서 활동 요소(예, 도서 입수 경로, 독서 상태 등)는 전통적인 도서관 분류체계에서 거의 다루어지지 않던 요소이지만, 의미 있는 비중을 차지하고 있었다. 소설 및 독서활동의 공간 정보 요소인 장소(S) 패싯으로는 소설의 공간적 배경(14.0%), 도서 입수 장소(3.2%), 독서 장소(1.3%), 출판 장소(0.1%)가 식별되었으며, 소설 작품과 독서활동과 관련된 시간 정보 요소인 시간(T) 패싯은 소설의 시간적 배경(4.5%), 독서 시기 (3.6%), 문예 사조(1.4%), 출판일(1.0%), 도서 입수 시기(0.6%) 순으로 드러났다.
소설 이용자가 가장 많이 언급했던 패싯 유형은 소설의 내용적, 외형적 성질과 관련된 재료(M) 패싯으로, 상위범주의 절반 이상(13개 범주)이 식별되었다. 흥미로운 것은 소설 이용자들이 전통적인 도서관 분류체계에서 제공되는 주제(11.
한편, 본 연구는 소설의 서지정보로부터 소설의 제목, 저자, 출판사 사전을 직접 구성하고, 각 개체 유형에 대한 매칭 규칙을 마련하여 소설과 연관된 개체명을 인식하였다. 소설의 서지정보로부터 소설과 연관된 개체명(제목, 저자, 출판사)과 관련된 사전을 직접 구성하여 개체명을 인식한 결과, 저자로 인식된 태그 수는 88개, 제목으로 인식된 태그 수는 64개, 출판사로 인식된 태그 수는 19개로 각각 나타났다. 사전을 통한 NER 결과를 Stanford NER 결과와 통합한 결과, 최종적으로 개체명으로 인식된 태그의 개수는 1,541개로, 핵심 도서태그(N=3,730) 가운데 NER을 통해 자동으로 초벌 분류된 비율은 41.
수와 관련된 개체명으로 날짜(DATE), 숫자(NUMBER), 서수(ORDINAL)가 있었는 데, 날짜(DATE)로 인식된 태그들의 경우, 독서일, 시대적 배경, 문학의 시기 구분 등이 나타 났으며, 숫자(NUMBER)의 경우, 도서/DVD 의 시리즈, 서가의 위치, 도서 평점, DDC 분류 번호(예, 미국소설을 의미하는 813) 등이, 서수 (ORDINAL)의 경우, 도서의 판과 쇄, 시리즈, 복본, 작가의 활동 시기, 작품의 창작 시기 등과 관련된 태그들이 분류되었다. 기간(DURATION)의 경우, 도서의 시대적 상황과 관련한 기간이나 독서 기간과 관련된 태그 등이 식별되었다.
137)을 사용하여 코더간 일치도가 80% 이상 도달할 때까지 반복적으로 재수행하며, 코딩 체계를 수립하였다. 최종적으로 두 명의 코더간 일치도는 89.3%였으며, 최종적으로 확립된 코딩 체계를 전체 데이터에 적용하였다. 한편, 소설 검색의 패싯 유형에 대한 결과는 자료 조직 관련 연구 경험이 있는 박사급 연구자 1인으로부터 동료 검증(peer debriefing)을 통한 전체적 리뷰를 거쳤다.
본 연구를 통해 파악된 소설 검색의 패싯 요소는 전통적인 소설 색인에서 드러나지 않았던 요소는 물론, 기존에 색인 요소를 보다 세분화 하는 요소들을 식별해 내었다. 특히 소설 자료와 독자와의 상호작용 행위와 관련되는 에너지 (E) 패싯의 요소가 독서활동 요소(예, 도서 입수 경로, 독서 상태, 독자 반응, 독자 리뷰, 독서 프로그램 등)와 독서활동에 유용한 정보 요소 (예, 추천도서리스트, 문학상, 독서 수준 등)로 식별되었고, 소설을 구성하는 내용적, 외형적 성질을 의미하는 재료(M) 패싯과 관련해서도 이용자들이 소설에 대해 매우 세부적으로 접근하는 양상을 파악할 수 있었다. 예를 들면, 등장 인물 요소와 관련해서도 등장인물을 인간과 동물이나 신 등 인간 이외의 요소로 구분하고 있으며, 인간 가운데서도 이름뿐만 아니라, 직업, 인종, 성별, 역할, 관계, 성격, 연령, 종교와 같은 세부적인 속성으로 구분하여 탐색하고 있는 것을 파악할 수 있었다.
먼저, 가장 다양한 요소가 식별된 소설의 재료(M) 패싯은 소설의 내용이 어떻게 이루어지 고, 물리적인 외형은 어떻게 구성되었는지와 관련된 속성으로, 도서태그는 이용자가 소설에 내용적, 외형적으로 어떤 측면에 초점을 맞추 는지와 관련해서 다양한 관점을 보여주고 있다 (<표 4> 참고). 특히, 소설 자료와 관련된 외형적 성질(예, 매체 형식, 시리즈, 언어, 형태 사항, 판 사항, 출판사)보다 내용적 측면에 대한 다양한 접근점이 소설 이용자로부터 식별되었으며, 소설 이용자들은 장르와 등장인물과 관련된 속성을 매우 세부적으로 구분하여 탐색하고 있는 것으로 드러났다. 예를 들면, 장르 패싯의 하위 속성으로 주제, 형식, 지역, 시기, 이용자 연령으로 구분하여 탐색하고 있었으며, 장르의 주제인 판타지 소설 내에서도, ‘steampunk (역사적 배경에 공상과학이나 판타지 요소를 적용하고 전자제품 대신 증기로 작동하는 기계가 등장하는 문학 장르)’나 ‘sword and sorcery(검마 소설, 판타지 장르의 하위 장르)’와 같이 매우 세부적인 구분으로 접근하는 것으로 드러났 다.
한편, 소설 자료를 형성하는 주체와 관련된 개체(P) 패싯 유형의 소설 제목은 상대적으로 가장 적은 비중(3.6%)을 차지했는데, 이는 사전을 통한 NER 과정에서 제목을 식별할 때, 3개 이하의 단어로 구성된 태그의 경우 미리 구성된 사전과 완전히 일치하는 경우에만 타이틀로 판정하는 등 비교적 엄격한 규칙을 적용한 결과로 보인다. 또한, 이용자 태그의 경우 태그 길이가 긴 것을 선호하지 않는 데서 비롯된 결과로 추정할 수 있다.
그외, 소설을 읽으면서 느꼈던 감상(독자 반응), 읽고 난 후의 평가(독자 리뷰), 독서를 원활하게 하기 위한 다양한 활동 관련 속성(예, 개인 독서 리스트, 독서 프로그램, 독서토론 동호회)도 소설과 관련하여 이용자들이 의미있게 고려하는 것으로 드러났다. 한편, 추천도서 리스트, 문학상, 대상 독자, 독서 수준, 전문가 리뷰와 같은 독서활동에 유용한 다양한 정보와 관련된 속성도 드러났다. 단, 여기서 ‘대상 독자’ 나 ‘독서 수준’은 도서 자체가 지니는 성질로 해석하여 재료(M) 패싯으로 간주할 수도 있으나, 본 연구에서는 해당 속성이 도서 자체에 초점이 있는 것이 아니라, 이용자와 연관되어 해석 되었다는 점에 방점을 두고, 에너지(E) 패싯으로 해석하여 분석하였다.

후속연구

한편, 소설 이용의 접근점 개선을 통해, 최근 인문학 열풍과 더불어 독서문화를 장려하는 사회적 분위기와 소셜 리딩(social reading)과 같은 변화된 환경의 기대에 부응할 수 있다는 점에서 또한 의미가 있다. 도서정보 이용자에게 소설 장르에 특화된 다양한 속성을 탐색 접근점으로 제시함으로써, 보다 세분화된 정보요구를 충족 시킬 수 있을 것으로 기대된다.
본 연구의 결과로부터 도출된 패싯 요소는 향후 소설 색인 등 메타데이터 작성에서 참고할 수있을 것으로 보이며, 도서관 OPAC이나 소설 DB에 패싯 내비게이션 형태로 적용하여 이용자의 탐색 접근점을 확장할 수 있을 것으로 기대된 다. 한편, 소설 이용의 접근점 개선을 통해, 최근 인문학 열풍과 더불어 독서문화를 장려하는 사회적 분위기와 소셜 리딩(social reading)과 같은 변화된 환경의 기대에 부응할 수 있다는 점에서 또한 의미가 있다.
또한, 반복적인 코딩 과정과 제2 코더에 의한 코더간 신뢰도 검증, 동료 검증의 프로세스에도 불구하고, 내용분석 과정에서의 연구자의 바이어스도 배제할 수 없다. 본 연구의 한계는 다양한 샘플을 대상으로 유사한 연구가 반복적으로 진행되는 것을 통해 보완되고 검증될 수 있을 것으로 보인다.
본 연구에서는 방대한 태그 데이터를 일관되고 신속하게 처리하기 위해, 전체 태그 데이터 집합에서 핵심 태그 집합을 선별하였으며, 소설 검색의 패싯 유형을 구분하는 내용분석을 하기 이전에, NER 기법을 적용하여 자동으로 유사한 패턴이 발견되는 태그들을 초벌 분류하 였다. 이러한 방식은 향후 유사한 연구에도 적용될 수 있으리라 본다. 다만, 본 연구의 샘플은 도서태그 활동이 활발한 영미권의 사회적 목록을 대상으로 하였기 때문에 영미권 소설 이용 자의 요구로 한정되며, 분석 결과에 문화적 차이가 내포될 수 있다.

질의응답

핵심어	질문	논문에서 추출한 답변
	소설 색인은 어떻게 발전해왔는가?	이용자의 소설 탐색 환경을 개선하기 위한 가장 근본적인 노력은 소설 색인이다. 소설 색인은 정보조직과 검색 연구에서 꾸준히 논의되어 온 주제로(Saarti, 2019), 전통적인 정보조직체계에서 소설 콘텐츠 자체가 지닌 요소(예, 주제, 플롯, 등장인물, 시간적 배경 등)에 초점을 맞추었던 것과 더불어 다양한 이용자 연구를 통해 소설 이용자의 다양한 해석과 관계된 요소 (예, 저자의 의도, 내용을 읽고 이해하기 쉬운 정도(readability), 내용에 대한 감상 등)를 파악하고 체계화하는 것으로 발전하여왔다. 소설 콘텐츠의 요소를 파악하고 체계화하는 방식은 기존 분류체계를 기반으로 소설 콘텐츠 고유의 요소를 구성하거나 소설 자료에 특화된 분류체계를 만드는 형태로 이루어져 왔다(Pejtersen, 1997).
	웹 2.0 환경에서 이용자가 생성한 도서정보 태그를 통해 무엇이 가능해졌는가?	웹 2.0 환경에서 이용자가 생성한 도서정보 태그(이하 도서태그)는 도서 자체에 대한 기술과 묘사는 물론, 전통적인 도서조직 체계에서 표현할 수 없었던 도서와 독자와의 상호작용 내용 표현이 가능한 것으로 여겨졌다. 또한, 도서태그의 주제 표현 기능도 여러 연구를 통해 주제명표목표를 보완하는 도구로 기능할 수 있음을 시사한 바 있다(Wu, He, Qiu, Lin, & Liu, 2013).
	NER 기법을 사용해 도서태그들의 개체명 유형을 자동으로 식별하는 초벌 분류를 먼저 수행하는 이유는?	데이터 분석은 핵심 도서태그 데이터로 선정된 3,730개의 도서태그를 대상으로 NER 기법을 사용하여 도서태그들의 개체명 유형을 자동으로 식별하는 초벌 분류를 먼저 수행하였다. 이는 대량의 도서태그 컬렉션으로부터 특정 속성에 대응되는 태그를 자동으로 감지하여 보다 효율적으로 분류하기 위함이다. NER을 통한 초벌 분류 과정에서는 두 가지 방식을 결합하였다.

참고문헌 (31)

Kim, Dong-Suk, & Chung, Yeon-Kyoung (2010). A study on the application of librarything folksonomy tags through the analysis of elements related with work. Journal of the Korean Society for Information Management, 27(1), 41-60. https://doi:10.3743/KOSIM.2010.27.1.041

원문보기 상세보기
Lee, Seungmin (2011). Construction of folksonomy tag framework using bibliographic record. Journal of the Korean Society for Library and Information Science, 45(2), 185-207. https://doi:10.4275/KSLIS.2011.45.2.185

원문보기 상세보기
Adkins, D., & Bossaller, J. E. (2007). Fiction access points across computer-mediated book information sources: A comparison of online bookstores, reader advisory databases, and public library catalogs. Library & Information Science Research, 29(3), 354-368. https://doi:10.1016/j.lisr.2007.03.004

상세보기
Atdag, S., & Labatut, V. (2013). A comparison of named entity recognition tools applied to biographical texts. Paper presented at the 2nd International Conference on Systems and Computer Science, Villeneuve d'Ascq, France. https://doi.org/10.1109/icconscs.2013.6632052
Bartley, P. (2009). Book tagging on LibraryThing: How, why, and what are in the tags? Proceedings of the American Society for Information Science and Technology, 46(1), 1-22. https://doi:10.1002/meet.2009.1450460228
Broughton, V. (2006). The need for a faceted classification as the basis of all methods of information retrieval. Aslib Proceedings, 58(1-2), 49-72. https://doi:10.1108/00012530610648671

상세보기
Chung, Y. K. (2014). A study on varieties of subject access and usabilities of the national library of Korea subject headings. Journal of the Korean Biblia Society for Library and Information Science, 25(4), 171-185. https://doi:10.14699/kbiblia.2014.25.4.171

원문보기 상세보기
Desrochers, N., Laplante, A., Martin, K., Quan-Haase, A., & Spiteri, L. (2016). Illusions of a "Bond": Tagging cultural products across online platforms. Journal of Documentation, 72(6), 1027-1051. https://doi:10.1108/jd-09-2015-0110

상세보기
Elson, D. K., & McKeown, K. R. (2010). Automatic attribution of quoted speech in literary narrative. Paper presented at the Twenty-Fourth AAAI Conference on Artificial Intelligence, Atlanta, Georgia, USA.
Flick, U. (2019). An introduction to qualitative research (18th ed.). Los Angeles: Sage.
Golder, S. A., & Huberman, B. A. (2006). Usage patterns of collaborative tagging systems. Journal of Information Science, 32(2), 198-208. https://doi:10.1177/0165551506062337

상세보기
Holsti, O. R. (1969). Content analysis for the social sciences and humanities. MA: Addison-Wesley Pub. Co.
Iosif, E., & Mishra, T. (2014). From speaker identification to affective analysis: A multi-step system for analyzing children's stories. Paper presented at the Proceedings of the 3rd Workshop on Computational Linguistics for Literature, Gothenburg, Sweden. https://doi.org/10.3115/v1/w14-0906
Lawson, K. G. (2009). Mining social tagging data for enhanced subject access for readers and researchers. Journal of Academic Librarianship, 35(6), 574-582. https://doi:10.1016/j.acalib.2009.08.020

상세보기
Lu, C. M., Park, J. R., & Hu, X. H. (2010). User tags versus expert-assigned subject terms: A comparison of LibraryThing tags and Library of Congress Subject Headings. Journal of Information Science, 36(6), 763-779. https://doi:10.1177/0165551510386173

상세보기
Manning, C. D., Surdeanu, M., Bauer, J., Finkel, J. R., Bethard, S., & McClosky, D. (2014, June). The Stanford CoreNLP natural language processing toolkit. Paper presented at the 52nd annual meeting of the Association for Computational Linguistics, System Demonstrations, Stroudsburg, PA. https://doi.org/10.3115/v1/p14-5010
Morbhead, D. R., Pejtersen, A. M., & Rouse, W. B. (1984). The value of information and computer-aided information seeking: Problem formulation and application to fiction retrieval. Information processing & management, 20(5-6), 583-601. https://doi:10.1016/0306-4573(84)90075-X

상세보기
Nadeau, D., & Sekine, S. (2007). A survey of named entity recognition and classification. Lingvisticae Investigationes, 30(1), 3-26. https://doi:10.1075/li.30.1.03nad

상세보기
Pejtersen, A. M. (1980). Design of a classification scheme for fiction based on an analysis of actual user-librarian communication, and use of the scheme for control of librarian's search strategies. In O. Harboe & L. Kajberg (Eds.), Theory and Application of Information Research (pp. 146-159). London: Mansell.
Pejtersen, A. M. (1997). Subject access to Scandinavian fiction literature: Index methods and OPAC development. Copenhagen: Nordic Council of Ministers.
Pejtersen, A. M., & Austin, J. (1983). Fiction retrieval: experimental design and evaluation of a search system based on users’ value criteria (part 1). Journal of Documentation, 39(4), 230-246. https://doi:10.1108/eb026750

상세보기
Pejtersen, A. M., & Austin, J. (1984). Fiction retrieval: experimental design and evaluation of a search system based on users’ value criteria (part 2). Journal of Documentation, 40(1), 25-35. https://doi:10.1108/eb026755

상세보기
Ranganathan, S. R. (1967). Prolegomena to library classification (3rd ed.). Bombay; New York: Asia Publishing House.
Saarti, J. (1999). Fiction indexing and the development of fiction thesauri. Journal of librarianship and information science, 31(2), 85-92. https://doi.org/10.1177/096100069903100203

상세보기
Saarti, J. (2019). Fictional literature, classification and indexing. Knowledge Organization, 46(4), 320-332. https://doi:10.5771/0943-7444-2019-4-320

상세보기
Satija, M. (2017). Reviews of Concepts in Knowledge Organization. Knowledge Organization, 44(4), 291-307. https://doi:10.5771/0943-7444-2017-4-291
Smith, T. (2007). Cataloging and you: Measuring the efficacy of a folksonomy for subject analysis. Paper presented at the 18th workshop of the American Society for Information Science and Technology Special Interest Group in Classification Research, Milwaukee, WI.
Solomon, P. (1997). Access to fiction for children: A user-based assessment of options and opportunities. Information Services & Use, 17(2), 139-146. https://doi.org/10.3233/isu-1997-172-308

상세보기
Wilson, H. W. (2016). Fiction Core Collection (18th ed.). Ipswich, Massachusetts: Grey House Publishing, Inc.
Wu, D., He, D. Q., Qiu, J., Lin, R. N., & Liu, Y. (2013). Comparing social tags with subject headings on annotating books: A study comparing the information science domain in English and Chinese. Journal of Information Science, 39(2), 169-187. https://doi:10.1177/0165551512451808

상세보기
Yu, L., & O'Brien, A. (1997). Constructing references from the book to the reader in fiction searching, an experiment on the construction of information cues from the reading context approach. Information Services & Use, 17(2-3), 187-199. https://doi.org/10.3233/isu-1997-172-315

상세보기

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증