소셜빅데이터는 아동청소년의 학교폭력 현상에 대한 풍부하고 다각적 시각을 제공할 수 있지만, 복잡하고 다양한 비정형 텍스트로 구성되어 있어 자료의 체계적인 수집과 활용이 어렵다. 소셜빅데이터의 수많은 정보 가운데 의미 있는 개념을 추출하고 자료를 효과적으로 수집하기 위해서는 연구주제에 상응하는 핵심용어를 명시하고, 해당 개념 간의 관계를 나타내주는 온톨로지의 역할이 중추적이다. 본 연구는 온톨로지의 개념을 정리하고, 7단계에 걸친 온톨로지 개발 과정을 구체적으로 설명한 후, 학교폭력 소셜빅데이터 수집 및 분석을 위한 온톨로지 구축에 적용하였다. 그 결과, 학교폭력의 대상, 원인, 유형, 장소, 지역, 대응방안 6가지 영역을 중심으로 최상위 계층인 대분류를 구성하고, 중분류 및 소분류 체계를 거쳐 총 2,400여 개의 핵심용어를 도출하였다. 본 연구의 의의는 온톨로지 수집 및 개발과정을 설명하고, 기존의 연구방법과는 다소 차별을 두는 소셜빅데이터를 활용한 연구모형을 학교폭력 연구에 제시하였다는 것이다. 소셜빅데이터 분석의 기초가 되는 온톨로지 개발 연구는 좁게는 학교폭력 대상자들에 대한 이해를 제고시킬 뿐 아니라, 거시적으로는 학교폭력이라는 사회현상을 바라보는 한국사회의 시각에 대한 정보를 제공하는 실천적 함의가 있다.
소셜빅데이터는 아동청소년의 학교폭력 현상에 대한 풍부하고 다각적 시각을 제공할 수 있지만, 복잡하고 다양한 비정형 텍스트로 구성되어 있어 자료의 체계적인 수집과 활용이 어렵다. 소셜빅데이터의 수많은 정보 가운데 의미 있는 개념을 추출하고 자료를 효과적으로 수집하기 위해서는 연구주제에 상응하는 핵심용어를 명시하고, 해당 개념 간의 관계를 나타내주는 온톨로지의 역할이 중추적이다. 본 연구는 온톨로지의 개념을 정리하고, 7단계에 걸친 온톨로지 개발 과정을 구체적으로 설명한 후, 학교폭력 소셜빅데이터 수집 및 분석을 위한 온톨로지 구축에 적용하였다. 그 결과, 학교폭력의 대상, 원인, 유형, 장소, 지역, 대응방안 6가지 영역을 중심으로 최상위 계층인 대분류를 구성하고, 중분류 및 소분류 체계를 거쳐 총 2,400여 개의 핵심용어를 도출하였다. 본 연구의 의의는 온톨로지 수집 및 개발과정을 설명하고, 기존의 연구방법과는 다소 차별을 두는 소셜빅데이터를 활용한 연구모형을 학교폭력 연구에 제시하였다는 것이다. 소셜빅데이터 분석의 기초가 되는 온톨로지 개발 연구는 좁게는 학교폭력 대상자들에 대한 이해를 제고시킬 뿐 아니라, 거시적으로는 학교폭력이라는 사회현상을 바라보는 한국사회의 시각에 대한 정보를 제공하는 실천적 함의가 있다.
Although social big data can provide a multi-faceted perspective on school bullying experiences among children and adolescents, the complexity and variety of unstructured text presents a challenge for systematic collection and analysis of the data. Development of an ontology, which identifies key te...
Although social big data can provide a multi-faceted perspective on school bullying experiences among children and adolescents, the complexity and variety of unstructured text presents a challenge for systematic collection and analysis of the data. Development of an ontology, which identifies key terms and their intricate relationships, is crucial for extracting key concepts and effectively collecting data. The current study elaborated on the definition of an ontology, carefully described the 7 stage development process, and applied the ontology for collecting and analyzing school bullying social big data. As a result, approximately 2,400 key terms were extracted in top-, middle-, and lower-level categories, concerning domains of participants, causes, types, location, region, and intervention. The study contributes to the literature by explaining the ontology development process and proposing a novel alternative research model that uses social big data in school bullying research. Findings from this ontology study may provide a basis for social big data research. Practical implications of this study lie in not only helping to understand the experience of school bullying participants, but also in offering a macro perspective on school bullying as a social phenomenon.
Although social big data can provide a multi-faceted perspective on school bullying experiences among children and adolescents, the complexity and variety of unstructured text presents a challenge for systematic collection and analysis of the data. Development of an ontology, which identifies key terms and their intricate relationships, is crucial for extracting key concepts and effectively collecting data. The current study elaborated on the definition of an ontology, carefully described the 7 stage development process, and applied the ontology for collecting and analyzing school bullying social big data. As a result, approximately 2,400 key terms were extracted in top-, middle-, and lower-level categories, concerning domains of participants, causes, types, location, region, and intervention. The study contributes to the literature by explaining the ontology development process and proposing a novel alternative research model that uses social big data in school bullying research. Findings from this ontology study may provide a basis for social big data research. Practical implications of this study lie in not only helping to understand the experience of school bullying participants, but also in offering a macro perspective on school bullying as a social phenomenon.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 Noy와 McGuinness[19]의 모형을 기본 틀로 활용하여 한국 아동청소년의 학교폭력 소셜빅데이터 수집 및 분석을 위한 온톨로지를 개발하는 과정을 상세히 설명하고, 완성된 온톨로지 모형을 제시하였다. 본 연구에서 개발한 온톨로지는 학교폭력의 형태 및 유형, 학교폭력의 원인, 학교폭력 대상자들의 개인·가정·사회적 특징, 정책적·사회적 반응 및 대응방안 등의 내용을 포함하고 있다.
본 연구에서 아동청소년 학교폭력의 대상, 원인, 유형, 장소, 지역, 대응방안의 6가지 영역과 관련된 핵심용어들을 이론, 법·제정, 서비스·프로그램에 대한 다양한 자료원에서 추출했을 뿐 아니라, 인터넷 자료를 직접 검색함으로써 아동청소년들이 흔히 사용하는 은어, 신조어도 파악하려는 노력을 취했다.
이에 본 연구는 온톨로지의 개념을 이해하고, 소셜빅데이터를 통해 학교폭력 현상을 이해하는 데에 있어서 온톨로지의 효용성을 제시하고, 소셜빅데이터 수집에 활용될 학교폭력 온톨로지 개발과정 및 결과를 상세히 설명한다.
제안 방법
각 채널의 검색브라우저에 검색 기간을 본 연구의 자료수집 기간인 2013년도부터 2017년도까지로 설정하고, 검색단어를 “학교폭력 AND 청소년” 또는 “학교폭력 AND 중학생” 등으로 설정하여 검색을 시행하였다.
학술자료나 정책⋅제도 자료 이외에도 아동청소년의 학교폭력 온톨로지 개발을 위한 핵심용어를 추출하기 위해 학교폭력이 이루어지거나 연관되는 장소 및 지역을 나타내는 자료를 참고하였다. 구체적으로 학교폭력 이 이루어지는 공간적인 특성을 이해하기 위해 직접적 이거나(PC방, 교실, 화장실 등) 간접적인(카카오톡, 인스타그램, 페이스북 등) 가해가 이루어질 수 있는 학교 폭력 장소와 학교폭력이 언급되는 시군 단위의 행정 지역에 대한 정보를 추출하기 위해 이와 관계된 핵심용어를 수집하였다. 위의 정보는 학교폭력의 위험성을 증가시키는 유해환경에 대한 이해를 높이고, 학교폭력이 핵심용어로서 이슈화되는 행정 지역에 대한 정보를 제공할 것이다.
기존의 위기청소년 온톨로지[26] 와 서적, 논문, 법·제도, 서비스·프로그램, 행정문서, 소셜미디어 등 다양한 자료원을 활용하여 학교폭력 분류 체계를 구축하였다.
학교폭력 대응방안 영역은 학교폭력 문제의 사전예방 및 사후조치를 위하여 국가, 지자체, 또는 교육기관 등에서 행해지고 있는 여러 대응방안 관련 단어들을 모두 포함한다. 대응방안의 중분류는 세 가지 영역(법제도제정, 담당부처, 프로그램 운영)으로 구성하였다. 또 한, 대응방안은 지역과 마찬가지로 소분류가 불필요하다고 여겨져, 대분류 및 중분류로 하위분류체계를 구성 하였다.
아동청소년이 학교폭력의 가해자 또는 피해자가 되는 원인을 설명하는 단어들을 하나의 대분류로 구성하였으며, 이를 원인으로 명명하였다. 또한, 원인의 대분류 내에서는 특성요인, 긴장요인, 사회통제요인, 생태체계요인, 비행요인의 5가지 중분류로 분류하였다.
다음으로, 담당부처(청소상담지원센터, 청소년비행예방센터 등)에는 학교나 지역사회에서 아동청소년들의 학교폭력 실태를 파악하고 개입 방안을 모색하는 다양한 기관들을 포함하였다. 마지막으로 프로그램은, 아동청소년들에게 폭력 문제에 대한 심각성을 상기시키거나 학교 폭력 상황에서 올바르게 대처할 수 있는 능력을 기를 수 있게 도움을 주는 다양한 예방교육 및 상담프로그램 (1388헬프콜, 치유캠프 등)으로 구성되었다[표 8].
본 연구에서 개발한 온톨로지는 학교폭력의 형태 및 유형, 학교폭력의 원인, 학교폭력 대상자들의 개인·가정·사회적 특징, 정책적·사회적 반응 및 대응방안 등의 내용을 포함하고 있다.
본 연구에서는 대상, 원인, 유형, 장소, 지역, 대응방안 등의 영역에 대해 관련 분야 대학교수 3명과 대학원생 4명이 다양한 자료원을 검토하여 아동청소년 학교 폭력 현상과 관련된 핵심용어를 추출하였다. 학교폭력 현상과 관련된 이론에 대한 전문서적이나 논문과 같은 학술자료뿐만 아니라, 학교폭력을 언급한 블로그, 게시 판, 뉴스 등 소셜미디어에서 학교폭력 관련 용어들을 직접 검색하여 핵심용어를 추출하였다.
본 연구에서는 학교폭력 관련 핵심용어들을 유목화하고 계층화하여 클래스를 구성하는 데에 있어 하향식과 상향식을 함께 활용하는 복합식을 활용하였다. 학교 폭력의 대상자, 영역 및 유형, 기제, 대응방안, 지역 등의 상위클래스를 설정하여 전체적인 용어체계를 구성함으로써 하위클래스를 이루는 체계를 도출하는 하향식 방법을 활용하는 한편, 동시에 신체적, 피해자심리, 가해자심리 등 하위개념을 설정한 후, 이 개념들이 공 통으로 구성하는 학교폭력 원인이라는 상위개념을 도출하는 상향식 방법을 활용하였다.
먼저, 연령 관련 정보를 통해 해당 문서가 아동청소년과 관련된 문서인지 아닌지를 파악할 수 있을 뿐만 아니라, 현재 온라인상에서 특정 연령 대의 학교폭력 행동이 관심을 받고 있는지도 파악할 수 있다. 본 연구의 대상이 아동청소년이라는 점에 기반하여 연령을 다시 아동청소년 및 성인의 소분류로 구분하였고, 각 소분류에 해당하는 다양한 연령 표현 단어들 (8살, 8세, 초1 등)을 정리하였다. 다음으로, 형태는 학교폭력에 직·간접적으로 관련된 대상(모, 친구, 선배 등) 이 무엇인지에 대한 정보를 제공한다.
아동청소년의 학교폭력 경험을 확인하는 본 연구의 경우, 소셜빅데이터에 산재하여 있는 자료에서 학교폭력의 개념적 정의나 형태에 대한 이해를 높이고, 학교 폭력의 원인이나 이로 인한 사회적 결과를 함축할 수 있는 정보를 추출할 수 있는 내용으로 역량질문을 구성 하였다. 구체적으로 역량질문은 학교폭력의 대상자, 학교폭력의 형태 및 유형, 학교폭력의 원인 및 결과, 학교 폭력 참여자들의 개인·가정·사회적 특징, 정책적·사회적 반응 및 대응방안과 관련된 내용을 포함한다.
아동청소년의 학교폭력 현상을 설명하는 주요 이론을 선정한 후, 관련 저서나 학술논문 데이터베이스에서 이러한 이론을 활용한 자료를 검색하였다. 검색한 아동 청소년 학교폭력 관련 학술자료에서 반복적으로 등장하는 단어들을 온톨로지의 핵심용어로 선정하였다.
아동청소년 학교폭력 소셜빅데이터 자료 수집을 위한 온톨로지 개발은 활발히 진행되지 않았으며, 기존 연구는 주로 우울[12], 비만[23], 상담[24], 치료[25], 예방접종[21] 등을 주제로 한 보건·의료 분야에 집중되어 있다. 예외적으로 최근 위기청소년 분류체계를 제시한 선행연구[26]가 있어 이 연구를 기반으로 하여 아동 청소년 학교폭력 경험의 특수성을 반영할 수 있는 온톨로지 체계를 구축하였다.
학교폭력 유형 대분류는 온라인과 오프라인에서 직접적이거나 간접적인 형태로 행해지는 오늘날 아동청소년들의 학교폭력 방법들을 모두 포함한다. 유형 영역의 중분류로 먼저 직접폭력과 간접폭력으로 구분하였고, 이를 다시 각각 오프라인과 온라인 영역으로 구분하였다.
본 연구에서는 학교폭력 관련 핵심용어들을 유목화하고 계층화하여 클래스를 구성하는 데에 있어 하향식과 상향식을 함께 활용하는 복합식을 활용하였다. 학교 폭력의 대상자, 영역 및 유형, 기제, 대응방안, 지역 등의 상위클래스를 설정하여 전체적인 용어체계를 구성함으로써 하위클래스를 이루는 체계를 도출하는 하향식 방법을 활용하는 한편, 동시에 신체적, 피해자심리, 가해자심리 등 하위개념을 설정한 후, 이 개념들이 공 통으로 구성하는 학교폭력 원인이라는 상위개념을 도출하는 상향식 방법을 활용하였다.
본 연구에서는 대상, 원인, 유형, 장소, 지역, 대응방안 등의 영역에 대해 관련 분야 대학교수 3명과 대학원생 4명이 다양한 자료원을 검토하여 아동청소년 학교 폭력 현상과 관련된 핵심용어를 추출하였다. 학교폭력 현상과 관련된 이론에 대한 전문서적이나 논문과 같은 학술자료뿐만 아니라, 학교폭력을 언급한 블로그, 게시 판, 뉴스 등 소셜미디어에서 학교폭력 관련 용어들을 직접 검색하여 핵심용어를 추출하였다. 또한 관련 법령 및 제도와 각 부처에서 발행하는 보고서 등 행정 자료도 온톨로지의 핵심용어 추출에 활용하였다.
학교폭력의 장소는 학교 내외, 지역사회, 사이버 공간 등과 같이 학교폭력의 발생 가능성을 지닌 모든 공간을 포함하고자 하였으며, 장소 영역의 중분류로 크게 오프라인과 온라인으로 분류하였다. 오프라인의 경우, 학교(내), 학교 밖 생활공간, 유흥시설로 분류하였다.
학교폭력의 핵심용어를 추출한 후, 용어들의 유목화와 계층화를 통해 클래스를 구성하였으며, 클래스의 속성, 속성값, 개체를 부여함으로써 학교폭력 현상을 설명하는 용어체계로 구성된 온톨로지를 구축·완성하였다.
다음으로, 형태는 학교폭력에 직·간접적으로 관련된 대상(모, 친구, 선배 등) 이 무엇인지에 대한 정보를 제공한다. 형태는 아동청소년기에 중요한 관계에 해당하는 가족, 또래, 집단뿐만 아니라, 보편적으로 학생이나 기타 사람을 표현할 때 사용하는 단어들을 구분하여 5가지의 소분류체계로 이루어졌다[표 3]
대상 데이터
아동청소년의 학교폭력 현상을 설명하는 주요 이론을 선정한 후, 관련 저서나 학술논문 데이터베이스에서 이러한 이론을 활용한 자료를 검색하였다. 검색한 아동 청소년 학교폭력 관련 학술자료에서 반복적으로 등장하는 단어들을 온톨로지의 핵심용어로 선정하였다. 학술자료로부터 학교폭력의 원인 및 유형 관련 용어가 주로 추출되었으며, 온톨로지에 활용된 핵심용어의 구체적인 추출 근거 및 과정은 다음과 같다.
온톨로지의 핵심용어를 추출하기 위해 SNS(트위터), Blog, Café, Board, News Channel 등의 국내 오픈 사이트를 중심으로 학교폭력이라는 단어와 함께 문서에서 등장하는 단어들을 검색하였다. 국내 오픈사이트에서만 소셜빅데이터 수집이 가능하기 때문에 핵심용어 추출을 위한 검색도 상기 사이트를 중심으로 진행하였다. 각 채널의 검색브라우저에 검색 기간을 본 연구의 자료수집 기간인 2013년도부터 2017년도까지로 설정하고, 검색단어를 “학교폭력 AND 청소년” 또는 “학교폭력 AND 중학생” 등으로 설정하여 검색을 시행하였다.
온톨로지의 핵심용어를 추출하기 위해 SNS(트위터), Blog, Café, Board, News Channel 등의 국내 오픈 사이트를 중심으로 학교폭력이라는 단어와 함께 문서에서 등장하는 단어들을 검색하였다.
학술자료나 정책⋅제도 자료 이외에도 아동청소년의 학교폭력 온톨로지 개발을 위한 핵심용어를 추출하기 위해 학교폭력이 이루어지거나 연관되는 장소 및 지역을 나타내는 자료를 참고하였다.
이론/모형
본 연구에서 소셜빅데이터 자료 수집 및 분석을 목적으로 개발하고자 하는 학교폭력 온톨로지의 방법론적 틀은 Noy와 McGuinness의 연구[19]1에 기초하며 이를 번안, 수정 및 보완한 국내 선행연구[20-22]를 참고하였다. 구체적인 온톨로지 개발 과정에 대한 각 단계별 상세한 설명은 다음과 같다[그림 1]
성능/효과
아동청소년의 학교폭력 행동을 통제할 수 있는 내적 또는 외적 통제요인들을 의미하는 단어들이 포함되었다. 네 번째, 생태체계요인은 사회문화요인과 사회매체요인으로 구성되었으며 학교폭력 현상에 영향을 끼칠 수 있는 현대사회의 문화적 특징과 다양한 소셜 매체들이 해당 분류에 속하였다[표 4].
학교폭력의 가해 또는 피해 경험을 유발시킬 수 있는 개인의 신체적 또는 심리적 특징을 나타내는 단어들이 이에 포함되었다. 두 번째, 긴장요인은 가족긴장요인, 친구긴장요인, 학교긴장요인으로 구성되었다. 아동청소년기에 가족관계·친구 관계·학교생활로부터 경험할 수 있는 다양한 긴장요인을 표현하는 단어들이 해당 분류에 포함되었다.
아동청소년기에 가족관계·친구 관계·학교생활로부터 경험할 수 있는 다양한 긴장요인을 표현하는 단어들이 해당 분류에 포함되었다. 세 번째, 사회통제요인은 직접통제요인, 낮은자기통제요인, 높은자기통제요인, 애착요인, 관여요인, 참여요인, 신념 요인으로 구성되었다. 아동청소년의 학교폭력 행동을 통제할 수 있는 내적 또는 외적 통제요인들을 의미하는 단어들이 포함되었다.
셋째, 온톨로지 개발에 사용된 분류체계는 획일적이지 않으며 어떠한 참고자료를 기반으로 하는가에 따라 대분류별 하위분류체계가 다르게 설정될 수 있다. 예를 들어, 학교폭력 대응방안의 경우, 본 연구에서는 법제도, 담당부처, 프로그램 운영으로 중분류를 설정하였으나, 학교폭력 대응방안은 대응(지원)체계, 대응(지원)기관, 대응(지원)프로그램 등으로 분류가 가능하여, 소분류 역시 학교폭력 역할자 별 대응방안으로 구별이 가능할 수 있다.
첫 번째, 특성요인은 신체적 요인, 피해자심리요인, 가해자심리요인으로 구성되었다. 학교폭력의 가해 또는 피해 경험을 유발시킬 수 있는 개인의 신체적 또는 심리적 특징을 나타내는 단어들이 이에 포함되었다.
본 연구는 다음 세 가지 제한점을 지닌다. 첫째, 온톨로지에 아동청소년 학교폭력 관련 모든 핵심용어를 전부 추출하여 클래스를 정하고 속성을 부여하기란 현실적으로 불가능하다. 본 연구에서 아동청소년 학교폭력의 대상, 원인, 유형, 장소, 지역, 대응방안의 6가지 영역과 관련된 핵심용어들을 이론, 법·제정, 서비스·프로그램에 대한 다양한 자료원에서 추출했을 뿐 아니라, 인터넷 자료를 직접 검색함으로써 아동청소년들이 흔히 사용하는 은어, 신조어도 파악하려는 노력을 취했다.
후속연구
구체적으로 청소년보호법, 청소년기본법, 청소년복지지원법, 아동청소년의 성보호에 관한 법률, 아동복지법 등 학교 폭력과 관련된 다양한 법·제도적 대응방안을 확인할 필요가 있다.
위의 정보는 학교폭력의 위험성을 증가시키는 유해환경에 대한 이해를 높이고, 학교폭력이 핵심용어로서 이슈화되는 행정 지역에 대한 정보를 제공할 것이다. 그리하여 자료 분석 결과를 통해 위험요 인을 제거하고, 적절한 대응방안을 제시할 수 있을 것이다.
둘째, 학교폭력이라는 사회현상을 용어들로 구성된 체계로 전환하는 데 있어서 기술적인 한계점이 있다. 인간이 개발한 온톨로지를 컴퓨터가 정확하게 인식하지 못하는 경우가 있기 때문이다.
온톨로지 개발은 바로 이러한 소셜빅데이터 자료 수집 및 분석에 선행되어야 하는 단계이다. 따라서 아동청소년 학교폭력 온톨로지를 개발하고, 완성된 모형을 제시한 본 연구는 향후 실천가 및 연구자들에게 소셜빅데이터를 활용하여 아동청소년의 학교폭력 현상 뿐 아니라, 다양한 사회 문제에 대한 이해를 넓히는데 이바지할 것으로 기대한다.
질의응답
핵심어
질문
논문에서 추출한 답변
온톨로지란 무엇인가?
온톨로지(ontology)는 철학적 의미를 지닌 개념으로 ‘존재를 설명하는 특징들과 그 구조(nature and structure of reality)’라고 알려져 있다[15]. 최근 컴퓨터 과학 분야에서 온톨로지의 활용이 확산되고 있는 가 운데, 온톨로지의 개념이 ‘서로 공유하는 개념적 이해에 대한 형식적이고 명시적인 구체화 과정의 결과물 (formal, explicit specialization of a shared conceptualization)’로 재정립되어 사용되고 있다 [16].
소셜빅데이터 수집을 하는 데 있어서 온톨로지의 구축이 필수적인 이유는 무엇인가?
특히 소셜빅데이터 수집을 하는 데 있어서 온톨로지의 구축은 필수적이다. 온라인상의 정보로 표현되는 소셜빅데이터는 양적으로 방대한 비정형 텍스트 데이터 로서 자료의 체계적인 수집과 활용이 어렵기 때문이다. 따라서 수많은 정보 가운데 의미 있는 핵심용어를 추출하고 자료를 효과적으로 수집하기 위해서는 관심 분야의 핵심개념을 명시할 뿐 아니라, 해당 개념들 간의 관계를 나타내주는 온톨로지의 역할이 중요하다.
학교폭력의 유형인 직접적 폭력과 간접적 폭력은 어떻게 구분되는가?
먼저, 직접적 폭력과 간접적 폭력은 폭력의 종류나 결과에 따라 구분될 수 있다. 직접적 폭력은 폭행, 금품갈취, 감금 등과 같이 직접 신체적인 접촉이나 물리적으로 피해자를 괴롭히는 행위를 뜻하며, 간접적 폭력은 소문내기, 소외시키기, 비웃기 등과 같이 피해자가 정신적으로 고통을 느끼도록 하는 행위들을 뜻한다[41].
※ AI-Helper는 부적절한 답변을 할 수 있습니다.