최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.24 no.6, 2013년, pp.1429 - 1437
배규용 (동국대학교 통계학과) , 박주현 (동국대학교 통계학과) , 김정선 (한국보건사회연구원 보건정책연구본부) , 이영섭 (동국대학교 통계학과)
Research articles in food related to climate change were analyzed by implementing a text-mining algorithm, which is one of nonstructural data analysis tools in big data analysis with a focus on frequencies of terms appearing in the abstracts. As a first step, a term-document matrix was established, ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
텍스트 마이닝 기법을 이용하여 무엇을 하였는가? | 빅 데이터 분석기법 중 비정형데이터 분석기법인 텍스트 마이닝 기법을 이용하여 기후변화 관련 식품분야 논문 초록에서 용어들의 출현빈도를 분석하였다. 이를 위하여 용어-문헌 행렬을 만들고, 용어들간의 비유사성 측도를 바탕으로 계층적 군집분석기법을 적용하여 문서들을 군집화하였다. | |
텍스트 마이닝 기법은 어떤 기법인가? | 빅 데이터 분석기법 중 비정형데이터 분석기법인 텍스트 마이닝 기법을 이용하여 기후변화 관련 식품분야 논문 초록에서 용어들의 출현빈도를 분석하였다. 이를 위하여 용어-문헌 행렬을 만들고, 용어들간의 비유사성 측도를 바탕으로 계층적 군집분석기법을 적용하여 문서들을 군집화하였다. | |
기후변화 관련 식품분야 논문 초록에서 용어들의 출현빈도 분석 과정은? | 빅 데이터 분석기법 중 비정형데이터 분석기법인 텍스트 마이닝 기법을 이용하여 기후변화 관련 식품분야 논문 초록에서 용어들의 출현빈도를 분석하였다. 이를 위하여 용어-문헌 행렬을 만들고, 용어들간의 비유사성 측도를 바탕으로 계층적 군집분석기법을 적용하여 문서들을 군집화하였다. 군집화된 문서들간의 상호 연관성과 군집별로 특정용어의 빈도를 파악하여 문서군집을 특정주제별로 분류하였다. 이러한 연구를 통하여 식품분야의 기후변화 관련 논문들의 추세와 관심주제어를 파악할 수 있었으며, 향후 기후변화 적응 및 대응 체계 로드맵 작성 시 연구 개발 기초 자료로 활용할 수 있을 것이다. |
Baek, H., Cho, C., Kwon, W., Kim, S., Cho, J. and Kim, Y. (2011). Development strategy for new climate change scenarios based on RCP. Journal of Climate Change Research, 2, 55-68.
우리나라의 경우 지난 100년 (1912∼2010) 동안 기온은 1.8℃ 상승하였고, 강수량은 200mm이상 증가하여 세계 평균보다 더 빠르게 기후가 변화되고 있는 것으로 제시하고 있으며, 2020년에는 지난 40년 (1970∼2010) 평균치대비 1.8℃ 상승, 2050년에는 3.7℃상승할 것으로 전망하고 있다 (Baek 등, 2011).
Cho, S. and Kim, S. (2012). Finding meaningful pattern of key words in IIE transactions using text mining. Journal of the Korean Institute of Industrial Engineers, 38, 67-73.
Choi, K. and Lee, Y. (2011). The deduction of objective linguistic information using statistical methods - The grouping of the possibility of interdisciplinary research. Journal of the Korean Data & Information Science Society, 22, 49-55.
그러나 최근 소셜미디어 등 비정형 데이터의 증가로 인하여 기존의 정형데이터 분석 기법들을 비정형 데이터에 적용하는 기법들에 대한 연구가 활발히 진행되고 있으며, 객관적이고 실증적인 자료를 바탕으로 언어 자원을 활용할 수 있는 방법론이 필요하다 (Choi와 Lee, 2011).
Feinerer, I., Hornik, K. and Meyer, D. (2008). Text mining infrastructure in R. Journal of Statistical Software, 25, 1-54.
수집된 논문 초록을 이용하여 텍스트 마이닝에 필요한 용어-문헌 행렬 (term-document matrix)을 구성하기 위해 R 프로그램 3.0.1 버전의 tm 패키지 (Feinerer 등, 2008)를 사용하였다.
Feinerer, I. (2013). Introduction to the tm package text mining in R, R News, http://CRAN.R-project.org/doc/Rnews/.
각 단계 별 필요한 함수들의 이용방법은 패키지 사용설명서 (Feinerer, 2013)에 자세히 정리되어 있다.
Go, G., Jung, W., Shin, Y., Park, S. and Jang, D. (2011). A study on development of patent information retrieval using text mining, Journal of the Korea Academia-Industrial Cooperation Society, 12, 3677-3688.
Kim, J. and Jeong, C. (2012). Analysis of trend in construction using text mining method. Journal of The Korean Digital Architecture·Interior Association, 12, 53-60.
최근에 산업공학, 건축, 특허 등 다양한 분야에서 텍스트 마이닝 기법을 활용한 연구가 활발히 진행되어 왔다 (Cho와 Kim, 2012; Go 등, 2011; Kim과 Jeong, 2012).
Lim, J. and Lim, D. (2012). Comparison of clustering methods of microarray gene expression data. Journal of the Korean Data & Information Science Society, 23, 39-51.
Rousseeuw, P. J. (1987). Silhouettes : Graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 54-65.
계층적 군집분석 기법중 하나인 Ward 방법을 사용하여 용어들 간의 비유사성은 개별대상간의 거리로 측정을 하였으며, 군집의 수는 실루엣 (silhouette) 방법 (Rousseeuw, 1987)과 현장 전문가의 지식을 활용하여 집단간의 유사성 (homogeneity)을 가장 크게 하는 군집의 수를 찾았다.
Solomon, S., Qin, D., Manning, M., Chen, Z., Marquis, M., Averyt, K. B., Tignor, M. and Miller, H. L. (2007). Climate change 2007, Cambridge University Press, Cambridge, United Kingdom, 996.
Yeo, I. (2011). Clustering analysis of Korea's meteorological data. Journal of the Korean Data & Information Science Society, 22, 941-949.
군집분석에 대한 많은 연구가 진행되고 있으며 (Lim과 Lim, 2012; Yeo, 2011), 본 연구에서는 특정 주제에 관련된 용어들이 어떻게 군집을 이루는 지를 확인하기 위해 계층적 군집분석 방법 (hierarchical clustering)을 사용하였다.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.