$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

위키피디아 인물 아카이브 서비스 개선을 위한 분석 연구
Improving the Biography Archive Service of Wikipedia 원문보기

한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, v.52 no.1, 2018년, pp.447 - 467  

최상희 (대구가톨릭대학교 도서관학과)

초록
AI-Helper 아이콘AI-Helper

인물에 대한 기록정보는 사회의 주요 분야에서 특정기준에 맞는 유명한 인물에 한정하여 정보를 수집, 가공, 제공하는 인물데이터베이스 형태가 일반적이었으나 최근 위키피디아와 같이 이용자들이 참여하여 다양한 인물에 대하여 자유롭게 서술하며 디지털 아카이브로 축적하는 체제가 활성화되고 있다. 이 연구는 위키피디아 바이오그래피 포털에서 범죄자, 교수, 영화감독 카테고리에서 인물 유형별로 500건의 데이터를 각각 수집하여 서술된 내용간 유형별 차별성이 있는지 계량적으로 분석하였다. 용어의 빈도 분석과 차별지수 분석을 수행한 결과 차별지수가 각 유형별로 특화되어 있는 내용을 표현하는데 효과적인 것으로 나타났다. 이 연구에서는 차별지수값이 높은 상위 100개의 용어와 세 유형에 공통적으로 출현한 용어 고빈도어 100개를 워드 클라우드 형태로 활용하여 특정 유형의 인물에 대하여 서술하는 이용자와 이를 승인하는 에디터가 참조할 수 있는 가이드를 제시하고자 하였다.

Abstract AI-Helper 아이콘AI-Helper

Biographical information about people is usually collected and provided by a company or an institute which has a specific standard to select people for service. Recently, user oriented contents service like Wikipedia has started biographical information service, Wikipedia Biography Portal, in which ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 다이버전스 개념을 적용하여 차별어를 도출한 연구는 2013년 수행된 ‘정치와 언어의 관계에 대한 양적 분석 시론’ 연구에서 사용한 방법을 차용하였다(김하수 외 2013). 이 연구는 대통령 선거에서 특정 후보가 다른 후보들에 비해 더 많이 사용한 어휘(차별어)를 추출하여 분석하여 특정 후보의 특성을 파악하고자 한 연구이다. 이 연구에서 적용한 다이버전스 개념은 확률 분포 간의 차이를 측정하는 방법으로서 Kullback-Leibler 다이버전스 개념을 응용한 것이며 차별지수를 산출한 공식은 이재윤이 제시한 다이버전스 공식을 사용하였다(이재윤 2007).
  • 이 연구에서는 각 유형별 인물기록에서 나타난 용어를 계량적으로 분석하여 주제성을 나타내는 용어와 공통성을 나타내는 용어를 추출하여 활용하는 방안을 제시하였는데 다음과 같은 제한 사항이 도출되어 추가 연구로 발전시킬 필요성이 있는 것을 파악하였다. 첫째, 용어의 의미가 유형별 인물기록에서 다르게 나타났다.
  • 이 연구에서는 위키피디아 바이오그래피 포털의 범죄자, 교수, 영화감독 카테고리에서 인물 유형별로 500건의 데이터를 각각 수집하여 각 유형별로 특화된 요소들이 있는지 분석하여 이를 이용자와 에디터에게 제공함으로써 인물기록 서비스를 개선할 수 있는 도구를 제시하고자 하였다. 분석 결과는 다음과 같다.
  • 인물기록을 서술할 경우 각 유형별로 특화되는 정보도 서술하지만 인물이라는 서술대상이 공통적으로 가지고 있는 요소에 대해서도 서술을 하게 된다. 이 연구에서는 인물기록을 분석하면서 유형별 차별성도 파악하였지만 이용자가 인물에 대하여 서술할 때 공통적으로 나타나는 보편적인 개념도 분석 도출하여 이용자에게 가이드로 제공하고자 하였다. 범죄자, 교수,영화감독 세 유형에서 공통적으로 나타나는 용어 중 빈도 10개 이상의 총 11,841개 용어 중불용어를 제거하고 총 빈도순으로 상위 100위까지 용어를 주요 공통어로 추출하였다.
  • 이 연구에서는 차별어의 특성을 활용하여 차별지수로 산출된 용어 100개를 추출한 후 차별지수값을 반영하여 와 같이 워드클라우드로 생성하여 해당 유형의 인물기록을 서술하거나 열람하는 이용자에게 제시하고자 하였다.
  • 특정 인물에 대한 기록을 지역의 로컬리티콘텐츠 개발의 측면에서 발굴하여 컬렉션으로 발전시키는 연구가 수행되었는데 부산지역의 로컬리티를 대표하는 인물로 박기종이라는 특정인을 선정하여 관련된 사건과 공간 분석을 통해 설정한 주제 영역을 기반으로 지역사 인물 콘텐츠를 설계한 사례이다(현문수, 김동철 2013). 이 연구에서는 특정 인물의 생애사를 기술하는 것에서 확장하여 주요 활동을 선별하여 콘텐츠로 개발하고 연계하는 안을 제시하였다. 이와 유사하게 지역사에 대한 기록을 인물 중심으로 개발하는 연구로서는 경기지역 역사인물의 문화 콘텐츠화를 연구한 사례가 있었으며(김흥식, 김진형 2011) 부산지역의 로컬리티를 기록화하기 위해 부산의 인물 기록을 시대와 주제로 분석한 사례가 있었다(송정숙 2012).
  • 이와 연관된 후속연구로는 2008년 국내 언론사에서 구축운영하는 인물데이터베이스와 네이버에서 구축한 인물데이터베이스의 신규인물 선정과 업데이트체계에 대하여 분석하고 검색방식을 비교한 연구가 있다(한상길 2008). 이 연구에서도 대상인물을 특정기관에서 선정하다보니 대상인물의 다양성이 부족한 것이 문제점으로 지적되었고 정보 업데이트의 한계에 대하여 지적하였다. 또한 인물을 기술하는 항목이 고정되어 있어 인물의 특성을 다양하게 기술할 수 없는 것이 문제점으로 지적되었다.
  • 이러한 용어를 차별어라고 하는데 차별어는 특정 군집의 주제를 파악하기 위해 다른 군집에서보다 특정 군집에서 많이 출현하는 키워드를 분석하였는데 차별어가 특정 군집의 주제를 파악하는데 효과적인 것으로 나타났다(이재윤, 김수정 2016). 이 연구에서도 차별어의 개념을 적용하여 특정 유형별 인물기록에서 많이 나타나는 용어가 있는지를 조사하여 차별어가 특정 유형의 인물기록 특성을 표현하는지분석하였다. 차별지수는 유형별 인물기록에서 출현한 용어의 상대적 빈도 차이를 산출한 것으로 다이버전스(divergence) 개념을 적용하여 측정하였다.
  • 이러한 맥락에서 이 연구에서는 3개 유형을 실험적으로 선정하여 각 유형별로 인물기록을 서술하는 이용자들이 선택한 용어로 특정 유형의 인물 특성을 나타낼 수 있는 방안을 도출하여 해당유형의 인물기록을 서술하거나 검색할 때 참조할 수 있도록 제안하고자 하였다. 그 방안으로 차별지수로 산출한 차별어가 각 유형별로 특성을 나타낼 수 있는 주요어 역할을 할 수있는지 조사하였는데 <표 8>과 같다.
  • 이러한 문제점을 고려하여 이 연구에서는 위키피디아에서 인물기록을 대상으로 이용자가 참여하는 디지털 아카이브 서비스를 운영하는데 인물기록을 서술하는 이용자와 이를 승인하는 에디터가 인물의 유형을 반영하여 어떠한 기록들이 서술되어야 하는지 참조할 수 있는 방안을 제시하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
바이오그래피 포털의 문제점은 무엇인가? 바이오그래피 포털에서는 인물기록이 가지고 있는 중요한 요소인 국적, 성별, 직업 등 주요 패싯을 대분류로 하여 인물기록을 분류, 유형별로 인물기록을 제공하고 있다. 그러나 이용자들이 다양한 인물을 자유롭게 기술하는 형태로 인물기록 서비스가 운영되고 있어 특정 유형의 인물기록에서 중점적으로 다루어져야 할 요소나 공통적으로 서술되어야 할 요소들이 무엇인지 파악하기 매우 어려운 문제점이 있다. 따라서 인물기록을 서술하는 이용자나 또는 이용자가 서술한 인물기록을 승인하는 에디터도 특정 유형의 인물에서는 어떠한 사항들이 중점적으로기술되어야 하는지 알 수 없어 내용을 보완하거나 평가하는데 어려움이 따르고 있다.
효과적으로 운영될 수 있는 형태의 아카이브 2.0 서비스는 무엇인가? 이러한 요소를 적용하여 가장 효과적으로 운영될 수 있는 형태의 아카이브 2.0 서비스는 위키 형태의 서비스인데 이는 위키 형식의 기록정보서비스가 이용자 참여를 극대화할 수 있기 때문이다(김유승 2010).
아카이브 2.0이란? 이러한 문제점을 보완하는 방안으로 기록정보 관리를 중심으로 하는 아카이브 체제에서 이용자가 직접 참여하여 기록을 기술하고 공유하는 형태로 전환하는 아카이브 2.0이 언급되기 시작했다.
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로