$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터마이닝 기술을 이용한 한국과학기술인용색인DB 활용 방안 연구
A Study on Utilization of Korea Science Citation Database(KSCD) Based on Data Mining Techniques 원문보기

정보관리연구 = Journal of information management, v.43 no.4, 2012년, pp.191 - 210  

박종현 (충남대학교 컴퓨터공학과) ,  최선희 (한국과학기술정보연구원 정보서비스센터 국내정보팀) ,  김병규 (한국과학기술정보연구원 정보서비스센터 국내정보팀)

초록
AI-Helper 아이콘AI-Helper

한국과학기술정보연구원(KISTI)에서는 대량의 학술 정보들을 분류하여 저장하고 관리하기 위한 한국과학기술 인용색인 데이터베이스(KSCD)를 구축한 바 있다. 그러나 학술인용색인데이터들은 그 특성상 단순히 저장만을 위한 자료가 아니다. 즉, 저장된 데이터를 기반으로 사용자들에게 어떠한 서비스를 어떻게 제공할 것인지는 KSCD의 활용 측면에서 매우 중요한 문제이다. 예를 들어 사용자는 단순히 특정 저자가 기술한 학술 자료들을 검색하기를 원할 수도 있지만, 필요에 따라 해당 저자와 유사한 연구를 수행하는 저자들을 검색하기를 원할 것이다. 그러나 단순히 저장된 데이터만으로 이러한 서비스를 제공하기는 어렵다. 그러므로 본 논문에서는 한국과학기술인용색인 데이터베이스(KSCD)를 향후 어떻게 활용할 수 있는가에 대한 해답을 찾기 위해서는 국내외에서 현재 어떠한 서비스들을 제공하고 있는지 살펴보고 이와 관련하여 어떤 방향으로 연구가 진행해야 하는지를 모색한다. 특별히 데이터 마이닝 기술은 다양한 형태의 데이터로부터 데이터 속에 내포되어있는 특징(Feature)들을 추출하고 새로운 데이터 모델을 발견하여 의미 있는 정보를 추출해 내어 결국은 사용자의 의사 결정에 도움을 주는 것을 그 목적으로 한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 유용한 정보를 발견해 내는 것이다. 그러므로 본 논문에서는 이러한 데이터마이닝 기법을 학술인용색인데이터에 적용하여 제공할 수 있는 서비스들이 무엇이 있는지 논의한다.

Abstract AI-Helper 아이콘AI-Helper

Scholarly science citation data is typically of large volume and consists of a variety of data. Moreover, the volume of data is increasing more and more. Therefore, there are some requirements to store and manage the data efficiently and Korea Institute of Science and Technology Information (KISTI) ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문의 목적은 데이터마이닝 기법을 활용하여 학술인용색인데이터를 기반으로 사용자에게 서비스할 수 있는 분야들을 파악하고 현재 국내외의 연구 동향을 파악하는 것이다. 또한 더 나아가 국내학술인용색인데이터를 활용할 수 있는 방안에 대해서 논의한다.
  • 그 가운데 하나의 기술이 데이터마이닝 기법이며 몇몇 연구들은 이미 사용자의 만족도가 높은 서비스를 제공하기 위한 기반 기술로 사용되고 있는 실정이다. 본 논문에서는 학술인용색인데이터 기반 서비스를 위한 서비스 영역을 저자 식별, 공동 저자 관계, 특징 추출(메타데이터 추출), 인용 관계, 추론을 통한 의미 정보 획득, 학술데이터 평가, 시각화의 7가지로 정의하고 각 서비스를 위한 기존 연구들을 살펴보고 해당 영역에서 KSCD를 활용하여 서비스 할 수 있는 방향에 대하여 논의한다.
  • 그러므로 사용자가 어떠한 요구사항을 가지고 있는지, 어떠한 환경에 있는지 등을 고려한다면 학술인용색인데이터를 기반으로 데이터마이닝 기술을 적용하여 다양한 서비스를 제공할 수 있을 것으로 사료된다. 본 논문의 목적은 데이터마이닝 기법을 활용하여 학술인용색인데이터를 기반으로 사용자에게 서비스할 수 있는 분야들을 파악하고 현재 국내외의 연구 동향을 파악하는 것이다. 또한 더 나아가 국내학술인용색인데이터를 활용할 수 있는 방안에 대해서 논의한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
대용량의 데이터들을 기반으로 다양한 형태의 서비스를 제공하기 위해서 반드시 필요한 것은? 또한 학술 데이터의 특성상 학술 데이터들은 인용 표현과 같이 상호간에 다양한 형태로 연관관계를 내포하고 있는 것이 현실이다. 그러므로 이러한 대용량의 데이터들을 기반으로 다양한 형태의 서비스를 제공하기 위해서 반드시 필요한 것이 종합 분석이 가능한 학술데이터에 대한 대규모 인용 색인 데이터베이스이고 한국과학기술정보연구원(KISTI)에서는 2002년부터 대량의 국내 학술인용색인정보 들을 분류하여 저장하고 관리하기 위하여 한국과학기술인용색인 데이터베이스(KSCD)를 구축하여 서비스하고 있다. KSCD의 수록범위는 한국 741종의 주요 과학기술학술지에 출판된 논문을 그 대상으로 2002년부터 2010년까지 출판된 논문 32만 건과 참고문헌 600만 건이며 KJCR과 KSCI를 통해 JCR기준의 영향력지표, 인용수, 피인용수 등 관련지표들을 제공하고 있다.
과학기술인용색인 데이터베이스의 목적은? 그리고 국내 과학기술분야 학술지 인용지표 산출을 통해 학술지에 대한 정량적 평가도구로 활용하는 것과 국내의 과학기술논문의 유통 및 정보관리 활성화에 기여하는 것을 그 목적으로 하고 있으며 Lee(2011), Kim(2011)에서는 KSCD를 분석하고 활용하기 위한 몇몇 방법들을 제안하고 있다. 과학기술인용색인 데이터베이스의 목적은 단순히 학술 데이터를 보관하기 위한 것뿐만 아니라 이를 기반으로 사용자들에게 다양한 서비스를 제공하는 것이다. 예를 들어 특정 기관들 사이의 연구 활동 연계 지수에 대한 서비스, 분야별 연구 활동 지수에 대한 서비스, 또는 분야별 연구 활동이 왕성한 연구자들을 검색하고 이들의 연구 방향을 제시하는 서비스 등 무수히 많은 서비스들이 존재한다.
과학기술인용색인 데이터베이스의 목적인 학술 데이터를 기반으로 사용자들에게 제공하는 다양한 서비스의 예시는 무엇이 있는가? 과학기술인용색인 데이터베이스의 목적은 단순히 학술 데이터를 보관하기 위한 것뿐만 아니라 이를 기반으로 사용자들에게 다양한 서비스를 제공하는 것이다. 예를 들어 특정 기관들 사이의 연구 활동 연계 지수에 대한 서비스, 분야별 연구 활동 지수에 대한 서비스, 또는 분야별 연구 활동이 왕성한 연구자들을 검색하고 이들의 연구 방향을 제시하는 서비스 등 무수히 많은 서비스들이 존재한다. 이러한 서비스를 제공하기 위하여 현재 많은 연구들이 진행 중이며, 이미 몇몇 연구들은 안정된 서비스를 제공하고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (29)

  1. 강인수, 김평, 이승우, 정한민, 류범종. 2009. 저자 식별을 위한 대용량 평가셋 구축. 한국콘텐츠학회논문지, 9(11): 455-464. 

  2. 강인수. 2008. 저자식별을 위한 전자메일의 추출 및 활용. 한국콘텐츠학회논문지, 8(6): 261-268. 

  3. 강인수. 2008. 한글 저자명 중의성 해소를 위한 기계학습기법의 적용. 정보관리학회지, 25(3): 27-39. 

  4. 강인수. 2009. 한글 저자명 군집화를 위한 계층적 기법 비교. 정보관리연구, 40(2): 95-115. 

  5. 강인수. 2011. 동시인용정보를 이용한 동명이인 저자의 중의성 해소. 정보관리연구, 42(3): 167-186. 

  6. 남수현, 김홍기. 2005. Knowledge Extraction from Academic Journals Using Data Mining Techniques. 디지털정책연구, 3(1). 

  7. 이정연, 이재윤, 정한민, 강인수, 신숙경. 2007. 확률적 온톨로지와 연구자 네트워크를 이용한 심사자 자동 추천에 관한 연구. 정보관리학회지, 24(3): 43-65. 

  8. 최상희, 최선희. 2010. 오픈엑세스 학술지의 차세대 서비스 모형에 관한 연구. 정보관리학회지, 27(4): 89-107. 

  9. Afzal, M.T. 2009. "Improving Citation Mining." Proc. Networked Digital Technologies. 

  10. Alfonso Ibanez, Pedro Larranaga, Concha Bielza. 2011. "Using Bayesian networks to discover relationships between bibliometric indices. A case study of computer science and artificial intelligence journals." Scientometrics, 89(2): 523-551. 

  11. Bolanle Adefowoke Ojokoh, Ming Zhang, Jian Tang. 2011. "A trigram hidden Markov model for metadata extraction from heterogeneous references." Information Sciences, 181(9): 1538-1551. 

  12. Choi, S.-H., Kim, B.-K., Kang, M.-Y., You, B.-J., Lee, J. & Park, J.-W. (2011). "A study of citing patterns of Korean scientists on Korean journals." Journal of the Korean Society for information Management, 28(2): 97-115. 

  13. Eli Cortez, Altigran Soares da Silva, Marcos Andre Goncalves, Filipe de Sa Mesquita, Edleno Silva de Moura. 2009. "A flexible approach for extracting metadata from bibliographic citations." JASIST, 60(6): 1144-1158. 

  14. Erjia Yan, Ying Ding, Elin K. Jacob. 2012. "Overlaying communities and topics: an analysis on publication networks." Scientometrics, 90(1): 499-513. 

  15. Jakob Elming, Nizar Habash. 2007. "Combination of Statistical Word Alignments Based on Multiple Preprocessing Schemes." Proc. HLT-NAACL. 

  16. Jian Zhang, Chaomei Chen, Jiexun Li. 2009. "Visualizing the Intellectual Structure with Paper-Reference Matrices." IEEE Transactions on Visualization and Computer Graphics, 15(6): 1153-1160. 

  17. Jiejia Lin, Yunhong Xu, Shujin Cao. 2010. "Unraveling the Relationship between Co-Authorship and Research Interest." Proc. PACIS. 

  18. Kim Byung-Kyu, Kang Mu-Yeong, Choi Seon-Heui. 2011. "Citing Behavior of Korean Scientists on Foreign Journals in KSCD." Journal of the Korean society for information management, 28(2): 117-133. 

  19. Kwon Ki-Seok, Park Han-Woo P, So Min-Ho, Loet Leydesdorff. 2012. "Has globalization strengthened South Korea's national research system? National and international dynamics of the Triple Helix of scientific co-authorship relationships in South Korea." Scientometrics, 90(1): 163-176. 

  20. Lee, J.-W., Kim, B.-K., You, B.-J., Kang, M.-Y. 2011. "Design and application of process for creating and verifying Korean Journal Citation Report (KJCR)." Proc ICCC. 

  21. Michael Eckmann, Anderson Rocha, Jacques Wainer. 2012. "Relationship between high-quality journals and conferences in computer vision." Scientometrics, 90(2): 617-630. 

  22. Muhammad Tanvir Afzal, Hermann A. Maurer, Wolf-Tilo Balke, Narayanan Kulathuramaiyer. 2010. "Rule based Autonomous Citation Mining with TIERL." Journal of Digital Information Management, Vol.8: 196-204. 

  23. Shuming Shi, Fei Xing, Mingjie Zhu, Zaiqing Nie, Ji R. WenOther: BibTeX PubZone. 2009. "Anchor Text Extraction for Academic Search." Proc. ACL-IJCNLP. 

  24. Tingcan Ma, Gui-Fang Wang, Ke Dong, Mukun Cao. 2012. "The Journal's Integrated Impact Index: a new indicator for journal evaluation." Scientometrics, 90(2): 649-658. 

  25. Tomas Kuzar, Pavol Navrat. 2010. "Preprocessing of Slovak Blog Articles for Clustering." Proc. Web Intelligence/IAT Workshops. 

  26. Wen-Yau Cathy Lin, Mu-Hsuan Huang. 2012. "The relationship between co-authorship, currency of references and author self-citations." Scientometrics, 90(2): 343-360. 

  27. Ying Ding, Gobinda Chowdhury, Schubert Foo. 1999. "Template mining for the extraction of citation from digital documents." Proc. ICADL. 

  28. Ying Yang, Mingzhi Wu, Lei Cui. 2012. "Integration of three visualization methods based on co-word analysis." Scientometrics, 90(2): 659-673. 

  29. Zdenek Horak, Milos Kudelka, Vaclav Snasel, Ajith Abraham, Hana Rezankova. 2011. "Forcoa.NET: An interactive tool for exploring the significance of authorship networks in DBLP data." Proc. CASoN, 261-266. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로