$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

통계적 방법을 활용한 객관적 언어정보 도출 - 학제적 연구의 가능성 모색
The deduction of objective linguistic information using statistical methods - The grouping of the possibility of interdisciplinary research 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.22 no.1, 2011년, pp.49 - 55  

최경호 (전주대학교 기초의과학과) ,  이용욱 (전주대학교 한국어문학)

초록
AI-Helper 아이콘AI-Helper

최근 들어 여러 영역에서 통섭을 통한 융합을 이루려는 시도가 자주 나타난다. 학문에 있어서도 예외는 아닌바, 학제적 연구가 그 예라 하겠다. 통계학과 관련된 학제적 연구의 한 분야로 언어정보학 또는 계량언어학이라 일컬어지는 언어학 연구가 있다. 그런데 통계학과 언어학의 학제적 연구는 주로 언어학자들을 중심으로 이루어져 오고 있다. 따라서 통계학적인 측면에서 보면 언어학자들의 연구결과에 일부 부족한 부분이 분명 존재한다. 이에 본 연구에서는 일부 언어학 연구에서 나타나는 객관성확보의 부족한 면에 대한 보완을 통계적인 방법을 이용하여 수행함으로써, 통계학과 언어학의 '학제적연구'의 완성도를 높일 수 있는 방안에 대해 고찰해 보았다. 부언하면 본 연구에서는 언어학 연구에서 보다 객관적인 언어정보를 도출하는데 도움이 될 수 있는 여러 통계적인 방법들을 소개하고 응용 예를 보였다.

Abstract AI-Helper 아이콘AI-Helper

There are tries to unite through consilience in many fields. Interdisciplinary research is an instance of those. Linguistic studies called linguistic informatics or quantitative linguistics is a field of interdisciplinary research related with statistics linguists have studied chiefly statistics and...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구는 언어학과 통계학의 학제적 연구의 활성화에 기여하고자, 기존 언어정보 도출을 위한 언어학 연구에서 보다 객관화된 결론을 도출하는데 통계학이 기여할 수 방법을 소개하고자 하는데 그 목적이 있다. 이 목적을 달성하기 위해 먼저 기 수행된 언어학 연구 몇 가지를 먼저 소개해 보면 다음과 같다.
  • 그런데 최경호 (2007)나 차경엽과 이성덕 (2008) 등의 연구가 있기는 하지만, 아직까지 계량언어학을 위한 통계적인 방법의 개발이나 연구가 미미한 실정이다. 이에 본 연구에서는 계량언어학 연구 분야에 통계관련 학자들이 더욱 적극적인 관심을 보일 필요성 알리고자, 통계적 방법을 활용함으로써 언어정보의 도출 및 해석을 보다 객관적이고 과학적으로 할 수 있음을 예를 통하여 보였다. 향후 본 연구를 기와로 통계학을 중심으로 한 학제적 연구가 더욱 활성화되고, 이점이 어려운 여건에 처한 지방대학 통계학 관련 교수들의 활로를 모색하는 한 방편이 되기를 희망해 본다.
  • 이러한 시점에서 일부 연구에서 나타나는 객관성 확보의 부족한 면에 대한 보완을 함으로써, 통계학과 언어학의 ‘학제적 연구’의 완성도를 높일 수 있는 방안에 대한 고찰은 의미가 있다고 사료된다. 이에 본 연구에서는 언어학 연구에서 보다 객관적인 언어정보를 도출하는데 도움이 될 수 있는 여러 통계적인 방법들을 소개하고자 한다. 본 연구를 위하여 귀한 자료를 제공해주신 고려대학교 언어정보연구소 김동성 교수께 감사를 드린다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
언어학이란? 언어학이란 인간의 언어와 관련한 여러 현상을 과학적인 방법으로 연구하는 학문으로 언어의 기능과 본질, 언어의 역사, 언어의 변이, 언어와 인간관계 따위를 주로 연구하는 분야이다. 이러한 언어학 연구에서 그동안 사용되어 온 일반적인 연구 방법은, 모국어 화자의 직관에 의존한 논리적 설명이 대부분이었다.
계량언어학은 한국어 어휘와 구문의 특징을 직관이나 이론적 방법을 통해 설명하는 것과 다르게 어떤 연구방법을 위하여 탄생되었는가? 그런데 이 과정에서 대규모 언어자원을 효율적으로 활용하고, 나아가 정보화 시대에 필수적으로 요구되는 언어자원의 기계적 자동처리 등을 위해서는 객관적이고 실증적인 자료를 바탕으로 언어자원을 활용할 수 있는 방법론이 필요하다. 즉 한국어 어휘와 구문의 특징을 직관이나 이론적 방법을 통해 설명하는 것과 다르게, 명시적이고 객관적으로 실제 언어자료를 활용하여 한국어의 특징을 밝히는 효과적인 연구방법이 절실히 요구된다 (박병선, 2005). 이를 위하여 탄생된 연구 분야가 바로 대규모 자료처리에 필수적인 통계적인 처리방법론 등을 언어연구에 복합적으로 활용한 계량언어학 (quantitative linguistics)이다.
계량언어학은 통계적 방법을 활용함으로써 어떠한 이점을 갖는가? 나아가 계량언어학이란 국어정보학의 관점에서 보면, 코퍼스 (말뭉치, corpus)를 구성하고 계량화한 뒤 유의미한 계량단위에 대한 측정의 결과를 통계학적으로 분석하여 코퍼스에 담긴 내용의 성격과 코퍼스 자체의 성격을 비롯한 각종 의미를 규명하는 언어학의 한 분야이다 (임칠성, 2003). 이에 통계학이 주로 이용되는 언어학 연구 분야가 바로 계량언어학인 바, 언어연구에서 통계적인 방법을 활용함으로써 수작업에서 생길 수 있는 오류와 개인의 주관적 판단을 최소화하고 과학적·객관적인 방법으로 담론을 분석할 수 있는 이점을 갖게 된다. 국어정보학의 연구방법을 제시한 서상규와 한영균 (1999)에서는 기존의 언어학과는 달리 철저히 자료를 기반으로 하는 연구 영역으로, 코퍼스 안에서의 각 언어 단위들의 빈도(frequency)와 분포 (distribution) 그리고 연어 관계 (collocation relation) 등을 밝히는 일이, 의미나 기능을 밝히는 일 못지않게 중요한 과제가 되며, 결국 이들 단위의 통계적 특성을 밝히기 위한 방법론의 개발이 또 다른 중요한 과제의 하나가 된다고 하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. 강범모 (2003). , 고려대학교 출판부, 서울. 

  2. 김동성 (2009). , 강원대학교 인문과학연구소, 강원. 

  3. 김동성 (2010). , 한국외국어대학교 출판부, 서울. 

  4. 박병선 (2005). , 역락, 서울. 

  5. 박행렬 (2009). 한국 법과학의 영역 간 통섭에 관한 연구. , 34, 123-156. 

  6. 박희창 (2010). 올바른 연관성 규칙 생성을 위한 의사결정과정의 제안. , 21, 263-270. 

  7. 서상규, 한영균 (1999). , 태학사, 서울. 

  8. 신효필 (2009). , 서울대학교출판문화원, 서울. 

  9. 안상헌 (2009). 사회생물학적 '통섭'의 이데올로기적 성격. , 38, 155-182. 

  10. 임칠성 (2003). , 박이정, 서울. 

  11. 정한진, 이옥분, 서경희 (2007). 성인용 동사 이름대기 평가 어휘 목록. , 16, 161-172. 

  12. 차경엽, 이성덕 (2008). 실용통계 개발을 위한 새로운 제안. , 19, 187-195. 

  13. 최경호 (2007). 문학작품에 대한 계량언어학적 분석. , 18, 1057-1064. 

  14. 최경호, 황용주 (2007). 계량언어학 연구에서 통계적 방법의 활용. , 18, 269-278. 

  15. 황용주 (2007). , 박사학위논문, 전북대학교, 전북. 

  16. Manning, C. and Schutze, H. (1999). Foundations of statistical natural language processing, MIT Press, Cambridge, Massachusetts. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로