$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

검색용 MeSH 필터와 단어인접탐색 기법을 활용한 KoreaMed 검색 효율성 향상 연구
A Study on the Retrieval Effectiveness of KoreaMed using MeSH Search Filter and Word-Proximity Search 원문보기

한국산학기술학회논문지 = Journal of the Korea Academia-Industrial cooperation Society, v.18 no.5, 2017년, pp.596 - 607  

정소나 (가톨릭대학교 성의교정 도서관) ,  정지나 (전주대학교 보건관리학과)

초록
AI-Helper 아이콘AI-Helper

의학학술문헌에는 해부학적 조직이나 기관명이 종양, 질환 또는 감염 용어들과 서로 조합하여 사용되는 언어적 특성을 가지고 있다. 의학학술문헌을 검색할 때 데이터베이스가 제공하는 통제어휘도구인 Medical Subject Headings (MeSH)를 활용하면 합성어, 동의어, 그리고 관련어를 추가로 검색할 수 있어 검색효율이 높다. 본 연구에서는 위암(Stomach Neoplasms) 어휘군을 검색용 필터로 추가하는 방법과 동시출현용어의 거리를 측정하여 단어인접탐색 기법으로 검색효율성을 향상시키는 연구를 수행하였다. 검색용 MeSH에 추가할 어휘군을 결정하기 위해 실험데이터로 PubMed에서 중심주제어가 "Stomach Neoplasms"인 2007년~2016년 논문 8,625편을 내려 받아 논문제목으로부터 Stomach와 Neoplasms 관련 용어의 동시출현여부를 분석하였다. 검색효율성은 KoreaMed에서 검색되는 MEDLINE 학술지를 대상으로 "Stomach Neoplasms"가 MeSH로 색인되어 있는 277편으로 검증하였는데 MEDLINE MeSH, MeSH on Demand, 그리고 KoreaMed MeSH Indexer의 "Stomach Neoplasms" 색인어 추출여부와 검색용 필터로 어휘군을 적용했을 때, 그리고 동시출현 용어의 단어인접검색 기법을 적용했을 때 "Stomach Neoplasms"의 매칭여부를 비교하였다. 가장 출현빈도가 높은 용어는 "Gastric Cancer"로 2,780회 출현하였다. "Gastric Adenocarcinoma", "Gastric MALT Lymphoma" 등과 같이 "Stomach" 용어와 "Neoplasms" 관련 조직학적 용어가 조합된 경우는 7,376개(88.51%)였다. 동시출현 거리가 2단어인 용어는 "Stomach"와 "Neoplasms"의 합성어로 5,234개(70.95%)였다. 연구 결과 MeSH용어를 제외하고 973개의 용어를 후보어휘군으로 선정하였다. MEDLINE MeSH와 KoreaMed MeSH Indexer의 MeSH 매칭률은 209편(75.5%)이었는데 검색필터를 적용한 결과 263편(94.9%)으로, 동시출현 용어의 13단어 단어인접탐색 기법을 적용한 경우 268편(96.7%)으로 매칭률이 향상되었다. 본 연구를 통해 자연어 검색에 있어서 검색효율을 향상시키는 수단으로 검색용 시소러스를 사용하면 색인비용에 대한 부담이 적고, 통제어의 망라적 장점과 자연어가 가지는 용어의 특정성을 유지할 수 있음을 증명하였다. 또한 불리안 검색보다는 단어인접탐색 기법을 활용하면 정확률을 높일 수 있어 검색 효율성이 향상됨을 알 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

This study examined the method for adding related to "stomach neoplasms" as filters to the Medical Subject Headings (MeSH) for search as well as a method for improving the search efficiency through a word-proximity search by measuring the distance of co-occurring terms. A total of 8,625 articles pub...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 즉, type 2와 3만 “Stomach Neoplasms”이다. MeSH 색인 시에 색인전문가가 정확히 본문을 읽으면서 주의깊게 색인해야 하는 용어로 본 연구에서는 이러한 용어의 패턴도 분석하였다.
  • 텍스트마이닝 기술이 발전하여 자동분류하고 패턴을 인식하는 기술이 점차 지능화되고 있지만 결국 보다 자동색인을 통해 검색효율이 높일 수 있는 정교한 시소러스의 개발은 인간의 지적 해석능력 및 전문성에 의존할 수밖에 없다. PubMed에는 의학 학술용어의 특성이 잘 반영되어 있는 대량의 문헌집합으로 본 연구에서는 PubMed를 활용하여 생의학적 개념들 간의 유의미한 관련성을 찾고자 한다. PubMed에서 다양한 어휘들을 추출해내고 이를 패턴화하여 MeSH의 검색용 필터로 반영한다면 MeSH로 색인된 용어와 함께 검색이 이루어져 망라적이면서도 정확한 검색결과를 얻을 수 있을 것이다.
  • 그리고 KoreaMed에서 검색되는 MEDLINE 학술지를 대상으로 선정된 어휘군을 검색 필터로 적용해보고,단어인접탐색 기법을 적용하는 검증 실험을 통해“Stomach Neoplasms”의 매칭률이 향상되었는지를 분석하고자 한다.
  • 따라서 본 연구에서는 “Stomach Neoplasms” 기입어의 동시출현 빈도를 분석하였다.
  • 따라서 본 연구에서는 “Stomach Neoplasms”와 관련하여 주로 사용되는 언어 패턴(어휘, 표현 등)을 분석하기 위해 PubMed 문헌을 실험 데이터로 내려 받아 검색의 효율을 높일 수 있는 어휘군을 선정하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
바이오 텍스트마이닝은 어떤 기술을 적용하는가? 의료분야에서 활용되는 바이오 텍스트마이닝은 의학 학술문헌의 생의학적 문맥과 상호작용관계를 파악하여 개념들 간의 유의미한 관련성을 찾아내고자 자연언어처리 및 문서처리 기술을 적용한다. 바이오 텍스트마이닝 분야에서 많이 활용되고 있는 데이터베이스는 PubMed로 미국국립의학도서관(National Library of Medicine,이하 NLM)에서 구축하고 있다.
MEDLINE의 특징은? MEDLINE은 NLM의 학술지 선정위원회 평가를 거쳐 선정된 핵심 학술문헌 데이터베이스이다. 4,600여종 학술지 약 1,100만 편이 PubMed에서 검색되는데 의학분야의 대표적인 시소러스(Thesaurus)라 할 수 있는 Medical Subject Headings(이하 MeSH)에 의해 색인을 하고 있다는 것이 가장 큰 특징이다[2].
PubMed은 어디서 구축하는가? 의료분야에서 활용되는 바이오 텍스트마이닝은 의학 학술문헌의 생의학적 문맥과 상호작용관계를 파악하여 개념들 간의 유의미한 관련성을 찾아내고자 자연언어처리 및 문서처리 기술을 적용한다. 바이오 텍스트마이닝 분야에서 많이 활용되고 있는 데이터베이스는 PubMed로 미국국립의학도서관(National Library of Medicine,이하 NLM)에서 구축하고 있다. 현재 약 2,700백만 건의 문헌이 수록되어 있고 하루에도 수천편의 문헌들이 업데이트되고 있는 의학 분야에서 가장 독보적인 의학학술문헌 데이터베이스이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (23)

  1. S. L. De Groote, M. Schultz, D. D. Blecic, "Information-seeking behavior and the use of online resources: a snapshot of current health sciences faculty", Journal of the Medical Library Association, vol. 102, no. 3, p. 169, 2014. DOI: https://doi.org/10.3163/1536-5050.102.3.006 

  2. US National Library Medicine. Fact Sheet Bibliographic Services Division,(BSD) 2017. [cited 2017 Mar 2], Available From: https://www.nlm.nih.gov/archive/20050322/pubs/factsheet s/bsd.html.(accessed Mar., 31, 2017) 

  3. S. N. Jeong, C. S. Lee, "MeSH Semi Indexing of the Korean Biomedical Literature, using NLM Medical Text Indexer", in, Korea Society for Information Management, pp. 21-28, 2010. 

  4. Cochrane Library. How CENTRAL is created [cited 2017 Mar 31], Available From: http://www.cochranelibrary.com/help/central-help.html.(a ccessed Mar., 31, 2017) 

  5. Cochrane Library. Cochrane Crowd [cited 2017 Mar 31], Available From: http://crowd.cochrane.org/index.html. (accessed Mar., 31, 2017) 

  6. D. L. Sackett, W. M. Rosenberg, J. A. Gray, R. B. Haynes, W. S. Richardson, "Evidence based medicine: what it is and what it isn't", BMJ, vol. 312, no. 7023, pp. 71-72, 1996. DOI: https://doi.org/10.1136/bmj.312.7023.71 

  7. C. S. Lee, "Medical Database Search", Journal of the Korean Medical Association, vol. 53, no. 8, pp. 668-686, 2010. DOI: https://doi.org/10.5124/jkma.2010.53.8.668 

  8. M. Macedo-Rouet, J. F. Rouet, C. Ros, N. Vibert, "How do scientists select articles in the PubMed database? An empirical study of criteria and strategies", Revue Europeenne de Psychologie Appliquee/European Review of Applied Psychology, vol. 62, no. 2, pp. 63-72, 2012. DOI: https://doi.org/10.1016/j.erap.2012.01.003 

  9. N. Baumann, "How to use the medical subject headings (MeSH)", International Journal of Clinical Practice, vol. 70, no. 2, pp. 171-174, 2016. DOI: https://doi.org/10.1111/ijcp.12767 

  10. Korean Statistical Information System National Statistical Office. Cancer occurrence and death status. 2017 [cited 2017 Mar 2], Available From: http://kosis.nso.go.kr.(accessed Mar. 31, 2017) 

  11. US National Library of Medicine. Medical Subject Headings 2017. Available From: https://meshb.nlm.nih.gov/#/fieldSearch. (accessed Mar., 31, 2017) 

  12. A. Fritz, C. Percy, A. Jack, K. Shanmugaratnam, L. Sobin, D. M. Parkin, S. Whelan, International classification of diseases for oncology, World Health Organization, 2000. 

  13. US National Library Medicine. Search Strategy Used to Create the Cancer Subset on PubMed. 2017 [cited 2017 Mar 2], Available From: https://www.nlm.nih.gov/bsd/pubmed_subsets/cancer_strategy.html.(accessed Mar., 31, 2017) 

  14. C. C. Compton, D. R. Byrd, J. Garcia-Aguilar, S. H. Kurtzman, A. Olawaiye, M. K. Washington, "AJCC cancer staging atlas", pp. 143-153, Springer, New York, 2012. DOI: https://doi.org/10.1007/978-1-4614-2080-4 

  15. US National Library of Medicine. MeSH on Demand. Available From: https://www.nlm.nih.gov/mesh/MeSHonDemand.html.(accessed Mar., 31, 2017) 

  16. D. R. Swanson, N. R. Smalheiser, V. I. Torvik, "Ranking indirect connections in literature­based discovery: The role of medical subject headings," Journal of the American Society for Information Science and Technology, vol. 57, no. 11, pp. 1427-1439, 2006. DOI: https://doi.org/10.1002/asi.20438 

  17. S. Y. Bong, K. B. Hwang, "A Method for Author Keyphrase Recommendation for Bioinformatics Papers Using Assigned MeSH Terms", The HCI Society of Korea, pp. 236-238, 2011. 

  18. J. G. Mork, A. J. Jimeno-Yepes, A. R. Aronson, "The NLM Medical Text Indexer System for Indexing Biomedical Literature", in BioASQ@ CLEF, 2013. 

  19. A. Jimeno-Yepes, J. G. Mork, D. Demner-Fushman, A. R. Aronson, "A one-size-fits-all indexing method does not exist: automatic selection based on meta-learning", Journal of Computing Science and Engineering, vol. 6, no. 2, pp. 151-160, 2012. DOI: https://doi.org/10.5626/JCSE.2012.6.2.151 

  20. ICHUSI Web. 2017 [cited 2017 Mar 2], : Available From http://www.jamas.or.jp/index.html. (accessed Mar. 31, 2017) 

  21. US National Library Medicine. How can I become an indexer? 2017 [cited 2017 Mar 2], Available From: https://www.nlm.nih.gov/bsd/indexfaq.html#translator.(accessed Mar., 31, 2017) 

  22. G. S. Go, W. K. Jung, Y. G. Shin, S. S. Park, "A Study on development of patent information retrieval using textmining", Journal of the Korean Academia-Industrial cooperation Society, vol. 12, no. 8, pp. 3677-3688, 2011. DOI: http://doi.org/10.5762/KAIS.2011.12.8.3677 

  23. US National Library of Medicine. Unified Medical Language System (UMLS). Available From: https://www.nlm.nih.gov/research/umls/index.html. (accessed Mar., 31, 2017) 

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로