스마트폰을 비롯한 모바일 기기의 발달로 인터넷 이용 환경이 PC에서 모바일로 확대되었다. 이에 따라 웹을 통해 이동하면서 즐길 수 있는 콘텐츠, 이른바 웹 콘텐츠의 수가 증가하고 있다. 웹 콘텐츠는 웹에서 생성, 유통, 소비되는 모든 콘텐츠를 말하며, 다양한 모바일 기기에서 언제 어디서나 소비된다. 웹 콘텐츠의 형태는 동영상, 음악, 사진, 만화, 텍스트 등이 있다. 이러한 웹 콘텐츠의 범주화를 위한 다양한 연구들이 진행되었지만 링크를 이용해 페이지간의 ...
스마트폰을 비롯한 모바일 기기의 발달로 인터넷 이용 환경이 PC에서 모바일로 확대되었다. 이에 따라 웹을 통해 이동하면서 즐길 수 있는 콘텐츠, 이른바 웹 콘텐츠의 수가 증가하고 있다. 웹 콘텐츠는 웹에서 생성, 유통, 소비되는 모든 콘텐츠를 말하며, 다양한 모바일 기기에서 언제 어디서나 소비된다. 웹 콘텐츠의 형태는 동영상, 음악, 사진, 만화, 텍스트 등이 있다. 이러한 웹 콘텐츠의 범주화를 위한 다양한 연구들이 진행되었지만 링크를 이용해 페이지간의 관계성을 분석하거나 웹 페이지의 구조적인 내용에만 초점을 맞추었다. 또한 웹 콘텐츠의 감성을 긍정, 부정, 중립 세 가지로만 분류해왔다. 웹 페이지 자체를 구성하고 있는 텍스트를 분석하면 웹 페이지의 주제나 범주가 무엇인지 알 수 있다. 또한 웹 콘텐츠의 텍스트에서 기본감성과 차원감성을 추출한다면, 웹 콘텐츠의 범주와 더불어 콘텐츠 소비행태에서 패턴을 찾는 요소로 활용 될 수 있다. 일상생활에서의 콘텐츠 소비행태에 대한 연구는 단순히 웹 콘텐츠를 이용하는 기기와 이용시간, 이용빈도 등의 통계 분석에 그쳤다. 또한 콘텐츠 소비행태에 대한 데이터 수집은 주로 주관설문을 통해 이루어져왔다. 본 논문에서는 웹 콘텐츠의 텍스트를 이용해 카테고리와 기본감성, 차원감성을 자동으로 판별하는 콘텐츠 범주화 시스템을 구축했다. 또한 소비행태 데이터를 자동으로 수집하기 위해서 SociaL Browser라는 안드로이드 앱(App)을 만들었다. 콘텐츠 범주화 시스템은 사용자가 스마트폰으로 접속한 웹 페이지의 텍스트를 크롤링(Crawling)해 저장하고, 저장된 텍스트를 자연어처리(NLP)를 사용해 언어의 최소 의미 단위인 형태소로 분리했다. 분리된 어휘 각각을 미리 정의해 놓은 카테고리, 기본감성, 차원감성 각각을 대표하는 어휘 집합과 문서유사도를 비교해 판별했다. 콘텐츠 소비행태를 분석하고 동기화를 판별해 사용자들 간의 유의미한 연결성을 찾았다. 개개인의 웹 콘텐츠 소비행태를 모아 대중의 소비행태를 만들어 분석하면 대중의 패턴과 트렌드를 알 수 있다. 본 연구를 통해 콘텐츠 범주화에 바탕을 둔 패턴과 트렌드는 마케팅 요소로 활용 될 수 있으며, 여론조사를 대체할 수 있을 것으로 기대된다.
키워드 : 콘텐츠, 범주화, 소비행태, 동기화, 사회적 연결성
스마트폰을 비롯한 모바일 기기의 발달로 인터넷 이용 환경이 PC에서 모바일로 확대되었다. 이에 따라 웹을 통해 이동하면서 즐길 수 있는 콘텐츠, 이른바 웹 콘텐츠의 수가 증가하고 있다. 웹 콘텐츠는 웹에서 생성, 유통, 소비되는 모든 콘텐츠를 말하며, 다양한 모바일 기기에서 언제 어디서나 소비된다. 웹 콘텐츠의 형태는 동영상, 음악, 사진, 만화, 텍스트 등이 있다. 이러한 웹 콘텐츠의 범주화를 위한 다양한 연구들이 진행되었지만 링크를 이용해 페이지간의 관계성을 분석하거나 웹 페이지의 구조적인 내용에만 초점을 맞추었다. 또한 웹 콘텐츠의 감성을 긍정, 부정, 중립 세 가지로만 분류해왔다. 웹 페이지 자체를 구성하고 있는 텍스트를 분석하면 웹 페이지의 주제나 범주가 무엇인지 알 수 있다. 또한 웹 콘텐츠의 텍스트에서 기본감성과 차원감성을 추출한다면, 웹 콘텐츠의 범주와 더불어 콘텐츠 소비행태에서 패턴을 찾는 요소로 활용 될 수 있다. 일상생활에서의 콘텐츠 소비행태에 대한 연구는 단순히 웹 콘텐츠를 이용하는 기기와 이용시간, 이용빈도 등의 통계 분석에 그쳤다. 또한 콘텐츠 소비행태에 대한 데이터 수집은 주로 주관설문을 통해 이루어져왔다. 본 논문에서는 웹 콘텐츠의 텍스트를 이용해 카테고리와 기본감성, 차원감성을 자동으로 판별하는 콘텐츠 범주화 시스템을 구축했다. 또한 소비행태 데이터를 자동으로 수집하기 위해서 SociaL Browser라는 안드로이드 앱(App)을 만들었다. 콘텐츠 범주화 시스템은 사용자가 스마트폰으로 접속한 웹 페이지의 텍스트를 크롤링(Crawling)해 저장하고, 저장된 텍스트를 자연어처리(NLP)를 사용해 언어의 최소 의미 단위인 형태소로 분리했다. 분리된 어휘 각각을 미리 정의해 놓은 카테고리, 기본감성, 차원감성 각각을 대표하는 어휘 집합과 문서유사도를 비교해 판별했다. 콘텐츠 소비행태를 분석하고 동기화를 판별해 사용자들 간의 유의미한 연결성을 찾았다. 개개인의 웹 콘텐츠 소비행태를 모아 대중의 소비행태를 만들어 분석하면 대중의 패턴과 트렌드를 알 수 있다. 본 연구를 통해 콘텐츠 범주화에 바탕을 둔 패턴과 트렌드는 마케팅 요소로 활용 될 수 있으며, 여론조사를 대체할 수 있을 것으로 기대된다.
The internet environment has been expanded from PC to mobile, due to the evolution of mobile devices, such as smartphone. Therefore, The new contents have been published such as cartoon, drama, and novel in the web for consuming at anytime and at anywhere via mobile device. The types of the web cont...
The internet environment has been expanded from PC to mobile, due to the evolution of mobile devices, such as smartphone. Therefore, The new contents have been published such as cartoon, drama, and novel in the web for consuming at anytime and at anywhere via mobile device. The types of the web content are video, music, photo, cartoon, and text. Previous studies have been conducted to sort these web contents, however these studies have analyzed relation of the link between the web pages or have focused on the structure of the web pages. In addition, the emotion of the web contents only has been classified into three categories such as positive, negative, and neutral. The topic and category of the web contents were classified by analyzing the texts of the web pages. Moreover, the patterns of consumption behavior have been determined by discrete emotion and dimensional emotion extracted from the texts of the web pages. The consumption behavior of contents in daily life has been determined by analyzing the mobile devices, usage time, and usage frequency. They were subjective measurements. This study was to develop the contents categorization system and to determine category, discrete emotion, and dimensional emotion analyzing the texts of the web pages. Its android application named the ‘SociaL Browser’ has been developed to collect automatically data of the consumption behavior of contents. The contents categorization system has crawled and stored the texts in the web pages accessed through the smartphone. In addition, stored texts were divided into morphemes, which are the smallest unit of the language, using natural language processing(NLP). The categorization of morpheme set was determined by comparing document similarity with representative morpheme set of category, discrete emotion, and dimensional emotion, respectively. The meaningful connections between users were found using consumption behavior of contents and determined synchronization. Personal consumption behavior of the web contents become the consumption pattern of the public. Analysis of the consumption behavior of the public can grasp the trend. Pattern and trend based on the categorization can be utilized for marketing and can substituted for the poll.
Keyword : Contents, Categorization, Consumption Behavior, Synchronization, Social Connention
The internet environment has been expanded from PC to mobile, due to the evolution of mobile devices, such as smartphone. Therefore, The new contents have been published such as cartoon, drama, and novel in the web for consuming at anytime and at anywhere via mobile device. The types of the web content are video, music, photo, cartoon, and text. Previous studies have been conducted to sort these web contents, however these studies have analyzed relation of the link between the web pages or have focused on the structure of the web pages. In addition, the emotion of the web contents only has been classified into three categories such as positive, negative, and neutral. The topic and category of the web contents were classified by analyzing the texts of the web pages. Moreover, the patterns of consumption behavior have been determined by discrete emotion and dimensional emotion extracted from the texts of the web pages. The consumption behavior of contents in daily life has been determined by analyzing the mobile devices, usage time, and usage frequency. They were subjective measurements. This study was to develop the contents categorization system and to determine category, discrete emotion, and dimensional emotion analyzing the texts of the web pages. Its android application named the ‘SociaL Browser’ has been developed to collect automatically data of the consumption behavior of contents. The contents categorization system has crawled and stored the texts in the web pages accessed through the smartphone. In addition, stored texts were divided into morphemes, which are the smallest unit of the language, using natural language processing(NLP). The categorization of morpheme set was determined by comparing document similarity with representative morpheme set of category, discrete emotion, and dimensional emotion, respectively. The meaningful connections between users were found using consumption behavior of contents and determined synchronization. Personal consumption behavior of the web contents become the consumption pattern of the public. Analysis of the consumption behavior of the public can grasp the trend. Pattern and trend based on the categorization can be utilized for marketing and can substituted for the poll.
Keyword : Contents, Categorization, Consumption Behavior, Synchronization, Social Connention
※ AI-Helper는 부적절한 답변을 할 수 있습니다.