최근 모바일 인터넷과 정보통신의 발달, 특히 소셜미디어(Social Media)의 확산으로 인하여 정보량에 대한 증가가 기하급수적으로 늘어나고 있는 추세이다. 이러한 발달로 기업 및 사회는 대량으로 유입되고 있는 데이터를 기반으로 분석과 예측하기 위하여 데이터의 처리, 분석, 활용하는 기술을 필요로 하게 되었다(전명진, 2015). 이러한 소셜미디어의 전 세계적 확장은 새로운 온라인 인맥 형성과 기존 인맥 관계의 강화, 일상생활의 표현 및 다른 주요 정보의 획득 등 다양한 커뮤니케이션 기능으로 정보통신환경에 혁신적 변화를 일으키고 있는 추세이다(고준영 외, 2014). 데이터 수집을 위해 사회복지의 한 부분인 ‘국민연금’을 키워드로 선정하고, 인터넷뉴스에 존재하는 ‘국민연금’에 대한 내용에 해당하는 데이터를 ‘크롤링’하였다. 소셜미디어는 크게 블로그, 인터넷카페, ...
최근 모바일 인터넷과 정보통신의 발달, 특히 소셜미디어(Social Media)의 확산으로 인하여 정보량에 대한 증가가 기하급수적으로 늘어나고 있는 추세이다. 이러한 발달로 기업 및 사회는 대량으로 유입되고 있는 데이터를 기반으로 분석과 예측하기 위하여 데이터의 처리, 분석, 활용하는 기술을 필요로 하게 되었다(전명진, 2015). 이러한 소셜미디어의 전 세계적 확장은 새로운 온라인 인맥 형성과 기존 인맥 관계의 강화, 일상생활의 표현 및 다른 주요 정보의 획득 등 다양한 커뮤니케이션 기능으로 정보통신환경에 혁신적 변화를 일으키고 있는 추세이다(고준영 외, 2014). 데이터 수집을 위해 사회복지의 한 부분인 ‘국민연금’을 키워드로 선정하고, 인터넷뉴스에 존재하는 ‘국민연금’에 대한 내용에 해당하는 데이터를 ‘크롤링’하였다. 소셜미디어는 크게 블로그, 인터넷카페, SNS, UCC 등으로 분류가 가능한데, 본 연구에서는 오픈소스 ‘파이썬’을 통해 포털사이트에서 운영하는 인터넷뉴스 텍스트 데이터를 수집하였다. 수집된 데이터는 정제된 상태가 아니기 때문에 오픈소스 ‘R’을 이용해 전처리 및 주제어빈도분석과 워드클라우드를 실시하였다.
주제어 : 빅데이터, 분석, 국민연금, 뉴스, 비정형데이터, 소셜미디어
최근 모바일 인터넷과 정보통신의 발달, 특히 소셜미디어(Social Media)의 확산으로 인하여 정보량에 대한 증가가 기하급수적으로 늘어나고 있는 추세이다. 이러한 발달로 기업 및 사회는 대량으로 유입되고 있는 데이터를 기반으로 분석과 예측하기 위하여 데이터의 처리, 분석, 활용하는 기술을 필요로 하게 되었다(전명진, 2015). 이러한 소셜미디어의 전 세계적 확장은 새로운 온라인 인맥 형성과 기존 인맥 관계의 강화, 일상생활의 표현 및 다른 주요 정보의 획득 등 다양한 커뮤니케이션 기능으로 정보통신환경에 혁신적 변화를 일으키고 있는 추세이다(고준영 외, 2014). 데이터 수집을 위해 사회복지의 한 부분인 ‘국민연금’을 키워드로 선정하고, 인터넷뉴스에 존재하는 ‘국민연금’에 대한 내용에 해당하는 데이터를 ‘크롤링’하였다. 소셜미디어는 크게 블로그, 인터넷카페, SNS, UCC 등으로 분류가 가능한데, 본 연구에서는 오픈소스 ‘파이썬’을 통해 포털사이트에서 운영하는 인터넷뉴스 텍스트 데이터를 수집하였다. 수집된 데이터는 정제된 상태가 아니기 때문에 오픈소스 ‘R’을 이용해 전처리 및 주제어빈도분석과 워드클라우드를 실시하였다.
Recently, due to the development of mobile internet and information communication, especially social media, the amount of information is increasing exponentially. With these developments, companies and society are in need of technology to process, analyze and utilize data to analyze and forecast bas...
Recently, due to the development of mobile internet and information communication, especially social media, the amount of information is increasing exponentially. With these developments, companies and society are in need of technology to process, analyze and utilize data to analyze and forecast based on massive data (Jeon, Myeongjin, 2015). This global expansion of social media is changing the information communication environment with various communication functions such as the formation of a new online network, the strengthening of the existing social networking relationship, the expression of daily life and other important information (Ko JY, et al., 2014 ). To collect data, 'National Pension', a part of social welfare, was selected as a keyword and 'crawl' data corresponding to 'National Pension' existing in Internet news. Social media can be categorized as blog, internet cafe, SNS, UCC, etc. In this study, we collected internet news text data operated by portal site through open source 'Python'. Because the collected data is not in a refined state, pre-processing and subject-matter frequency analysis and word cloud are performed using open source 'R'.
Key words: big data, analysis, national pension, news, unstructured data, social media
Recently, due to the development of mobile internet and information communication, especially social media, the amount of information is increasing exponentially. With these developments, companies and society are in need of technology to process, analyze and utilize data to analyze and forecast based on massive data (Jeon, Myeongjin, 2015). This global expansion of social media is changing the information communication environment with various communication functions such as the formation of a new online network, the strengthening of the existing social networking relationship, the expression of daily life and other important information (Ko JY, et al., 2014 ). To collect data, 'National Pension', a part of social welfare, was selected as a keyword and 'crawl' data corresponding to 'National Pension' existing in Internet news. Social media can be categorized as blog, internet cafe, SNS, UCC, etc. In this study, we collected internet news text data operated by portal site through open source 'Python'. Because the collected data is not in a refined state, pre-processing and subject-matter frequency analysis and word cloud are performed using open source 'R'.
Key words: big data, analysis, national pension, news, unstructured data, social media
※ AI-Helper는 부적절한 답변을 할 수 있습니다.