본 연구는 인터넷 뉴스 사이트에 실린 청소년 문제를 탐색하고 그 동향을 파악하는데 목적이 있다. 국내 인터넷 뉴스 사이트 중 2018년 기준으로 상위 3위의 '조선일보', '동아일보', '중앙일보' 뉴스 사이트를 대상으로, 1993년부터 2018년 상반기까지 총 8,110건의 청소년 문제 관련 기사가 분석에 활용되었다. 연구 결과 최근 26년간의 인터넷 뉴스 사이트에서 청소년 문제가 어떤 주제로 기사화되어 왔는지 파악하였으며, 기사 추이가 청소년 문제와 관련된 시대별 환경, 정책, 문화 등을 고려하여 변화되어 왔음을 파악할 수 있었다. 본 연구는 기존 청소년 문제의 사회적 동향을 살펴보기 위한 방법에서 시작하여 청소년 문제나 청소년 상담의 범위를 확장하고 다양성을 고려하는데 정량적인 분석 방법을 사용하고 새로운 정보를 제공하는 것에 의의가 있다.
본 연구는 인터넷 뉴스 사이트에 실린 청소년 문제를 탐색하고 그 동향을 파악하는데 목적이 있다. 국내 인터넷 뉴스 사이트 중 2018년 기준으로 상위 3위의 '조선일보', '동아일보', '중앙일보' 뉴스 사이트를 대상으로, 1993년부터 2018년 상반기까지 총 8,110건의 청소년 문제 관련 기사가 분석에 활용되었다. 연구 결과 최근 26년간의 인터넷 뉴스 사이트에서 청소년 문제가 어떤 주제로 기사화되어 왔는지 파악하였으며, 기사 추이가 청소년 문제와 관련된 시대별 환경, 정책, 문화 등을 고려하여 변화되어 왔음을 파악할 수 있었다. 본 연구는 기존 청소년 문제의 사회적 동향을 살펴보기 위한 방법에서 시작하여 청소년 문제나 청소년 상담의 범위를 확장하고 다양성을 고려하는데 정량적인 분석 방법을 사용하고 새로운 정보를 제공하는 것에 의의가 있다.
The purpose of this research is to search for and identify trends in adolescent problems on internet news sites. Among the domestic internet news sites, 8,110 articles on adolescent problems from 1993 to 2018 were analyzed for the top three top-ranked 'The Chosunilbo', 'The Dong-A Ilbo', and 'Korea ...
The purpose of this research is to search for and identify trends in adolescent problems on internet news sites. Among the domestic internet news sites, 8,110 articles on adolescent problems from 1993 to 2018 were analyzed for the top three top-ranked 'The Chosunilbo', 'The Dong-A Ilbo', and 'Korea Joongang Daily' news sites. As a result of this study, we have been able to understand the topic of adolescent problems in internet news sites for the last 26 years and find out that the trend of articles has been changed considering the environment, policies and culture related to adolescent problems. This study is meaningful to start from the method to examine the social trends of existing adolescent problems, to expand the scope of adolescent problems and counseling, to use quantitative analysis methods and to provide new information to consider diversity.
The purpose of this research is to search for and identify trends in adolescent problems on internet news sites. Among the domestic internet news sites, 8,110 articles on adolescent problems from 1993 to 2018 were analyzed for the top three top-ranked 'The Chosunilbo', 'The Dong-A Ilbo', and 'Korea Joongang Daily' news sites. As a result of this study, we have been able to understand the topic of adolescent problems in internet news sites for the last 26 years and find out that the trend of articles has been changed considering the environment, policies and culture related to adolescent problems. This study is meaningful to start from the method to examine the social trends of existing adolescent problems, to expand the scope of adolescent problems and counseling, to use quantitative analysis methods and to provide new information to consider diversity.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
결론적으로 본 연구는 인터넷 뉴스 사이트에서 청소년 문제를 다룬 기사들을 통해 1993년에서 2018년까지 시대적 변화에 따른 청소년 문제의 변화 양상을 파악하고자 하였다. 이 연구는 청소년 문제의 이해와 그 해결을 위한 새로운 방향과 전략을 설정하는데 기초자료로 활용될 수 있을 것이라 기대한다.
치료 중심의 관점이 청소년의 문제를 사회 구조적인 문제가 아닌 개인의 문제로 치환하는 경향을 보이는[5] 한계를 극복하게 한다. 따라서 본 연구는 그동안 미디어가 청소년문제를 어떻게 보도하고 다루었는지 살펴보고, 주제별로 분류하고 주요 주제들의 비중과 변화추이를 파악하고자 한다.
본 연구는 대량의 뉴스를 자료원으로 빅데이터 분석에 주로 활용되는 텍스트마이닝 기법[6]을 이용하여 청소년 문제를 구성하는 핵심 키워드의 빈도, 문서수, 토픽 가중치 정보와 원문 검토를 통해 토픽을 도출하고자 한다.
제안 방법
전처리가 완료되면 세 번째 단계로 LDA 알고리즘에 의한 토픽 모델링 분석을 실시한 후 네 번째 단계로 대표 주제들을 추출하게 된다. 그리고 마지막 단계에서 년도별 또는 기간별로 추출된 주제들의 트렌드를 분석한다. 각 단계별 세부 처리 과정은 2.
그리고 본 연구에서 다루고자 하는 청소년문제의 유형을 알아보기 위해 검색 키워드를 ‘청소년’, ‘문제’로 정하였다.
단어들의 빈도수를 분석하여 빈도수 상위 2,000단어를 추출하였고, 이 중 본 연구 주제와 상관없는 용어인 ‘예정’, ‘올해’, ‘주요’, ‘가운데’, ‘각종’, ‘그동안’, ‘동안’, ‘마련’, ‘불과’, ‘이번’, ‘지난해’, ‘시절’, ‘마찬가지’, ‘최근’ 등을 문서에서 삭제하였다.
LDA기법을 활용하여 토픽 모델링을 실시하기 위해, 먼저 토픽수를 정하여야 한다. 본 연구에서는 perplexity를 이용하여 적절한 토픽수를 결정하고자 하였고, 5개부터 25개까지 perplexity를 구한 후 perplexity 값이 차이가 최소화되는 구간에서 토픽수를 정하였다. perplexity의 사전적 의미는 혼잡으로 이 수치의 차이값이 ‘0’에 가깝게 최소화 될 때 토픽 모델링의 결과가 좋다는 의미이다.
수집된 인터넷 뉴스 기사들을 모두 정렬한 후 중복 기사들을 제거하고, 기사 제목에 ‘수능’, ‘모집’, ‘안내’ 등의 특정 단어가 들어있는 기사는 ‘청소년 문제’와 관련성이 적다고 판단하여 제거하였다.
웹크롤링을 활용하여 수집된 데이터 중 기사본문의 형태소 분석을 실행하여 명사를 추출하여 기사본문을 대체하였다. 형태소 분석은 한국정보화진흥원(NIA)에서 한글 형태소 분석을 위해 R 언어용으로 제공하는 KoNLP 패키지의 형태소 분석사전인 NIADic 사전(983,012개의 단어 제공)을 활용하여 한글 보통명사들만을 추출하여, 각 기사들을 추출된 보통명사만으로 이루어지도록 변환하였다.
이상과 같은 분석 기법을 이용하여 17개의 토픽을 나타내는 주요 구성 단어 20개씩을 추출하였으며, 주제별 구성단어의 연관성을 중심으로 연구자가 토픽의 이름을 정하였으며 연도별로 토픽 추이를 그래프로 나타내었다.
웹크롤링을 활용하여 수집된 데이터 중 기사본문의 형태소 분석을 실행하여 명사를 추출하여 기사본문을 대체하였다. 형태소 분석은 한국정보화진흥원(NIA)에서 한글 형태소 분석을 위해 R 언어용으로 제공하는 KoNLP 패키지의 형태소 분석사전인 NIADic 사전(983,012개의 단어 제공)을 활용하여 한글 보통명사들만을 추출하여, 각 기사들을 추출된 보통명사만으로 이루어지도록 변환하였다.
대상 데이터
본 연구는 청소년 문제와 관련하여 영향력 있는 인터넷 뉴스 사이트 세 곳을 선정하였고 ‘청소년 문제’를 키워드로 데이터 분석을 실시하였다. 데이터를 수집하는데 있어 조직적이고 자동화된 방식인 웹크롤링을 사용하여 1993년부터의 기사를 분석에 활용하였으며, 26년간의 기사 총 12,946건을 분석에 적용하였다.
수집된 인터넷 뉴스 기사들을 모두 정렬한 후 중복 기사들을 제거하고, 기사 제목에 ‘수능’, ‘모집’, ‘안내’ 등의 특정 단어가 들어있는 기사는 ‘청소년 문제’와 관련성이 적다고 판단하여 제거하였다. 또한, 비정상적으로 짧은 기사는 삭제하여 최종적으로 정리된 1993년부터 26년간의 인터넷 뉴스 기사 12,946건을 분석에 사용하였다. 연도별 기사수는 표 2와 같다.
많은 인터넷 뉴스 사이트 중 객관적이면서 영향력 있는 “청소년 문제” 관련 기사를 검색하기 위하여 다음과 같은 과정으로 인터넷 뉴스 사이트를 선정하였다.
본 연구는 여러 인터넷 뉴스 사이트 중 동일하게 1, 2, 3위를 한 조선일보(www.chosun.com)[9], 동아일보(www.donga.com)[10], 중앙일보(news.joins.com)[11]를 선정하였다. 그리고 본 연구에서 다루고자 하는 청소년문제의 유형을 알아보기 위해 검색 키워드를 ‘청소년’, ‘문제’로 정하였다.
본 연구는 청소년 문제와 관련하여 영향력 있는 인터넷 뉴스 사이트 세 곳을 선정하였고 ‘청소년 문제’를 키워드로 데이터 분석을 실시하였다.
표 1에 나타나 있는 것처럼 조선일보와 동아일보는 1993년부터 2018년까지, 중앙일보는 1966년부터 2018년까지의 기사가 수집되었다. 조선일보는 10,585건, 동아일보는 5,478건, 중앙일보는 901건으로 총 16,964건의 기사가 최초 검색되었고, 웹 크롤링을 통해 기사작성연도, 기사제목, 기사본문을 자동으로 수집하였다[12].
성능/효과
두 번째로 비중이 높은 토픽은 정부, 한국, 사회, 국민, 후보, 말, 대통령, 북한, 미국, 협력, 생각, 지원, 정책, 주장, 기업, 양국, 교육, 중국, 국가, 분야의 단어로 구성되어 있고 이는 ‘정치’와 관련된 단어들이다.
둘째, 알렉사닷컴(http://www.wikitree.co.kr/)은 미국사이트로 툴바를 이용해 전 세계 사이트 순위를 보여주고 있으며, 그 중 국내 매체를 2018년 기준으로 정리했을 때 상위 3위에 있는 뉴스 사이트는 ‘조선일보’, ‘동아일보’, ‘중앙일보’로 나타났다.
세 번째 높은 비중을 차지한 토픽은 게임, 교육, 프로그램, 기업, 지원, 학생, 활동, 사업, 대표, 분야, 사회공헌, 프로젝트, 지역, 아이디어, 운영, 콘텐츠, 학교, 창업, 서비스, 개발의 단어로 구성되어 있고 이는 ‘사회공헌활동’과 관련된 단어들이다.
세 번째 높은 비중을 차지한 토픽은 부모, 학교, 자녀, 친구, 말, 가출, 원조교제, 성, 학생, 집, 마음, 가정, 생각, 왕따, 사회, 상담, 술, 돈, 친구들, 어머니의 단어로 구성되어 있고 이는 ‘청소년상담’과 관련된 단어들이다.
세 번째 높은 비중을 차지한 토픽은 영화, 드라마, 방송, 장면, 공연, 아이돌, 연기, 가수, 프로그램, 연예인, 감독, 심의, 스타, 판정, 배우, 작품, 노래, 논란, 관객, 전재의 단어로 구성되어 있고 이는 ‘문화콘텐츠(대중문화)’ 와 관련된 단어들이다.
perplexity의 사전적 의미는 혼잡으로 이 수치의 차이값이 ‘0’에 가깝게 최소화 될 때 토픽 모델링의 결과가 좋다는 의미이다. 웹크롤링된 분석대상 전체 기사로 perplexity 값을 구한 결과, 토픽수 17개에서 차이 값이 최소화되었다. 그림 2의 그래프 변화를 보면 perplexity 값이 변화가 최소화되는 지점이 17-18 구간으로 나타난다.
첫째, 웹 사이트 순위, 주간리포트 등 소비자 분석을 통하여 순위를 정하는 랭키닷컴(www.rankey.com) 통해 조사한 결과, 2018년 3월 기준으로 상위 3위에 있는 뉴스 사이트는 ‘조선일보’, ‘동아일보’, ‘중앙일보’였다.
후속연구
불확실성과 복잡성을 함축하고 있는 청소년 주제를 분류하여 분석하고자 할 경우, 전문가의 주관적 판단의 한계에 부딪힐 문제를 해결하기 위해 정량적 객관적 데이터를 도출할 텍스트마이닝 연구 방법이 유용하다[7][8]. 또한 청소년 문제를 연구함에 있어 시대적 변화에 따른 청소년 문제의 양상들을 밝히고 상담 대상으로 청소년을 연구하고자 할 때 시대변화에 따른 새로운 방향과 전략을 설정해 보는 데 도움이 되리라 생각한다.
결론적으로 본 연구는 인터넷 뉴스 사이트에서 청소년 문제를 다룬 기사들을 통해 1993년에서 2018년까지 시대적 변화에 따른 청소년 문제의 변화 양상을 파악하고자 하였다. 이 연구는 청소년 문제의 이해와 그 해결을 위한 새로운 방향과 전략을 설정하는데 기초자료로 활용될 수 있을 것이라 기대한다.
향후 연구과제로서는 방대한 자료에서 얻은 결과에 대해 관련 분야 전문가들의 견해를 다양하게 반영하여 논의한 결과를 더욱 심도 있게 분석하고 청소년 문제 해결에 어떻게 적용할 것인지에 대한 연구가 필요할 것으로 생각한다.
질의응답
핵심어
질문
논문에서 추출한 답변
청소년기는 어떻게 이해되는가?
청소년기는 사춘기 중심으로 정신적, 신체적 변화를 경험하는 시기로 이해하고 있는데, 오늘날에는 청소년기를 정의할 때 심리적 변화와 사회구조적 차원까지 고려하고 있다. 또한 제4차 산업혁명 시대를 살아가는 현재의 청소년은 미디어 네이티브 세대로서 이전의 청소년에 대한 개념과는 다르게 이해할 필요가 있다.
청소년 문제는 어떤 행위를 말하는 것인가?
청소년 문제는 청소년기에 이르러 사회적으로 바람직하지 않다고 생각하는 행동을 말한다. 다시 말하면 아동과 성인의 중간 단계에 있는 청소년들이 사회적 규범과 법률에 위배하는 행위를 하는 것으로 청소년 비행, 청소년 범죄, 일탈행위 등이 모두 포함된다[1].
청소년들이 받고 있는 건강과 지위 위협은?
청소년 종합 실태 조사에 의하면, 청소년들은 정신적질병, 자살, 잦은 결석과 중퇴, 약물, 임신, 학교폭력 등다양한 분야에서 그들의 건강과 지위를 위협받고 있다. 청소년 문제행동이 양적으로 증가할 뿐 아니라 질적으로 그 심각성이 커지고 있으면서, 일부 연구자들은 이들 문제행동을 위험 행동의 개념으로 이해하려는 움직임이 확산되고 있다.
참고문헌 (12)
S. C. Shin, etc, Youth Problem and Protection, Seoul: Jungminsa, 2014.
J. Y. Kim, Youth Problems. Seoul: Knowledge Community, 2017.
J. W. Chun, Youth work practice : positive perspective, Seoul: Shinjeong, 2017.
Y. H. Shim, "Changes in Youth Problems in Korea under the IMF Management System : With a Risk Society Perspective," Korean Journal of Youth Studies, vol. 5, no. 3, pp. 115-145, Mar. 1998.
J. Kim, and S. Joo, "Analyzing the Change of Discourse about Adolescent Problems Based on the Foucault's Governmentality," Korea Journal of Counseling, vol. 18, no. 2, pp. 223-243, Feb. 2017.
J. Silge, and D. Robinson, Text Mining with R: A Tidy Approach, Sebastopol, CA:O'Reilly Media, Inc., 2017.
D. M. Jung, etc, "A Proposal of a Keyword Extraction System for Detecting Social Issues," Journal of Intelligent Information System, vol. 19, no. 3, pp. 1-23, Sept. 2013.
J. Y. Lee, and Y. Bak, "Social Network Analysis of author's interest area in Journals about Computer," Journal of the Korea Institute of Information and Communication Engineering, vol. 20, no. 1, pp. 193-199, Jan. 2016.
The Chosunilbo [Internet]. Available: http://www.chosun.com/.
Korea Joongang Daily [Internet]. Available: https://joongang.joins.com/.
The Dong-A Ilbo [Internet]. Available: http://www.donga.com/.
R. Mitchell, Web Scraping with Python: Collecting Data from the Modern Web, 1st edition, Sebastopol, CA:O'Reilly Media, Inc., 2015.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.