본 연구는 대한민국 정부가 운영하는 의견수렴 및 고충처리 전산망인 국민신문고(http://www.people.go.kr)'의 고용노동부 민원 정책 게시판의 의견을 통해 고용노동부에서 시행하는 직업훈련, 노사관계, 산업안전, 임금정책, 근로기준법 등의 민원 정책에 대한 국민적 의견을 수렴하여 분석하였다. 본 연구는 R프로그램 빅데이터 기법을 이용하여 데이터 시각화, 빈도 분석, 연관분석 등을 실시하였으며, 연구결과는 다음과 같다. 첫째, 한국의 복잡한 임금구조와 노사 간에 인식부족 등으로 임금개념의 불일치, 노사갈등 이 많은 민원요소로 발견되었다. 둘째, 최근 최저임금의 파격적 인상으로 인한 자영업자 및 근로자의 경제적 공황상태 등으로 기인한 각종 민원이 발생하고 있다. 셋째, 생산직 등 제조 분야 등의 영세한 사업장의 안전의식의 부재로 인한 산업재해가 끊임없이 발생하고 있으며, 일 가정 병립을 위한 제도적 뒷받침이 많이 부족한 것으로 나타났다.
본 연구는 대한민국 정부가 운영하는 의견수렴 및 고충처리 전산망인 국민신문고(http://www.people.go.kr)'의 고용노동부 민원 정책 게시판의 의견을 통해 고용노동부에서 시행하는 직업훈련, 노사관계, 산업안전, 임금정책, 근로기준법 등의 민원 정책에 대한 국민적 의견을 수렴하여 분석하였다. 본 연구는 R프로그램 빅데이터 기법을 이용하여 데이터 시각화, 빈도 분석, 연관분석 등을 실시하였으며, 연구결과는 다음과 같다. 첫째, 한국의 복잡한 임금구조와 노사 간에 인식부족 등으로 임금개념의 불일치, 노사갈등 이 많은 민원요소로 발견되었다. 둘째, 최근 최저임금의 파격적 인상으로 인한 자영업자 및 근로자의 경제적 공황상태 등으로 기인한 각종 민원이 발생하고 있다. 셋째, 생산직 등 제조 분야 등의 영세한 사업장의 안전의식의 부재로 인한 산업재해가 끊임없이 발생하고 있으며, 일 가정 병립을 위한 제도적 뒷받침이 많이 부족한 것으로 나타났다.
This study is based on the opinions of the Ministry of Employment and Labor and the Policy Bulletin of the National Intelligence Service (http://www.people.go.kr) The data were visualized, frequency analysis and correlation analysis using the R program Big Data method, and the analysis was conducted...
This study is based on the opinions of the Ministry of Employment and Labor and the Policy Bulletin of the National Intelligence Service (http://www.people.go.kr) The data were visualized, frequency analysis and correlation analysis using the R program Big Data method, and the analysis was conducted by analyzing the public opinion on civil affairs and policies such as industrial relations, industrial safety, wage policy, The results of this study are as follows: First, disagreement of wage concept and labor - management conflict were found as complaints factor due to complex wage structure in Korea and lack of awareness among labor and management Second, And there are various complaints caused by the economic panic of the workers etc. Third, in the absence of safety awareness of small business sites An industrial disaster is constantly occurring, and institutional support for work-family connection is lacking.
This study is based on the opinions of the Ministry of Employment and Labor and the Policy Bulletin of the National Intelligence Service (http://www.people.go.kr) The data were visualized, frequency analysis and correlation analysis using the R program Big Data method, and the analysis was conducted by analyzing the public opinion on civil affairs and policies such as industrial relations, industrial safety, wage policy, The results of this study are as follows: First, disagreement of wage concept and labor - management conflict were found as complaints factor due to complex wage structure in Korea and lack of awareness among labor and management Second, And there are various complaints caused by the economic panic of the workers etc. Third, in the absence of safety awareness of small business sites An industrial disaster is constantly occurring, and institutional support for work-family connection is lacking.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
국민신문고(국민 참여 포털시스템)는 대한민국 정부에서 조선의 신문고제도를 모티브 하여 마련한 통합형 온라인 공공민원창구이다. 본 논문은 국민신문고의 고용노동부 정책에 대한 민원내용 중 빈도수가 높은 키워드 및 그와 연관 된 키워드를 분석을 통해 고용노동부 사업에 대한 국민여론을 수렴하고 향후 고용노동부의 정책적 방향에 대한 시사점 및 방향성을 제시하고자 한다.
제안 방법
따라서 비정형화 데이터인 정부신문고 민원·정책 게시판의 각종 고용노동부 관련 민원의 키워드 추출을 통해 그 의미를 분석하고 민원인들이 가장 궁금해 하고 불편해하는 점이 무엇인지를 파악하여 시사점, 방향성 등을 제시하였다.
또한 시각화 패키지인 wordcloud2 패키지를 이용하여 빈도수 대비 이미지 시각화를 진행하였으며, 국민신문고에서 고용노동부 관련 민원·정책 항목에 가장 이슈화 된 키워드는 아래와 같다.
빅데이터 분석 기법은 분석 목적에 따라 기술적 분석 기법(descriptive Analytics), 예측적(predictive), 처방적 (prescriptive) 분석 기법이 있는데(이재덕 외, 2018)[9]. 본 논문에서는 기술적 분석기법을 통해서 서비스 관련 이미 발생된 데이터를 기준으로 계획사항과 진행상황, 문제 상황 등을 분석하는 방법을 적용하였다. 최근 중요한 데이터 원천으로서 활용도가 높아지고 있는 소셜 네트워크 서비스(Social Network Service) 상의 텍스트 및 이미지, 동영상, 음성 데이터 등은 대표적인 비정형 데이터라고 할 수 있다.
연구의 범위에서 언급한 바와 같이 자료 수집은 국민 신문고에 파이썬 크롤링 프로그램을 이용하였다. 추출 된 자료의 가공에는 R Studio 소프트웨어를 이용하여 KoNLP, Stringr 패키지를 이용하여 유의미한 명사를 추출하였으며, gsub() 함수를 이용하여 불용어 삭제 등 전처리를 통해 무의미한 용언, 특수문자, 숫자 등을 제거하 였다.
이때, 추출된 명사 중 상위 빈도키워드를 wordcloud 패키지를 이용하여 시각화를 수행하였다. 이 후 연관분석을 위한 트랜잭션 변환을 수행하고 각 키워드별 지지도(Support), 신뢰도(Confidence), 향상도(Lift) 를 구하여 선행키워드와 종속키워드의 연관도를 최종적으로 분석하였다. 전체적인 프로세스는 아래와 같다.
추출 된 자료의 가공에는 R Studio 소프트웨어를 이용하여 KoNLP, Stringr 패키지를 이용하여 유의미한 명사를 추출하였으며, gsub() 함수를 이용하여 불용어 삭제 등 전처리를 통해 무의미한 용언, 특수문자, 숫자 등을 제거하 였다. 이때, 추출된 명사 중 상위 빈도키워드를 wordcloud 패키지를 이용하여 시각화를 수행하였다. 이 후 연관분석을 위한 트랜잭션 변환을 수행하고 각 키워드별 지지도(Support), 신뢰도(Confidence), 향상도(Lift) 를 구하여 선행키워드와 종속키워드의 연관도를 최종적으로 분석하였다.
연구의 범위에서 언급한 바와 같이 자료 수집은 국민 신문고에 파이썬 크롤링 프로그램을 이용하였다. 추출 된 자료의 가공에는 R Studio 소프트웨어를 이용하여 KoNLP, Stringr 패키지를 이용하여 유의미한 명사를 추출하였으며, gsub() 함수를 이용하여 불용어 삭제 등 전처리를 통해 무의미한 용언, 특수문자, 숫자 등을 제거하 였다. 이때, 추출된 명사 중 상위 빈도키워드를 wordcloud 패키지를 이용하여 시각화를 수행하였다.
크롤링 된 데이터는 R studio application을 이용하여 명령을 실행하였으며, 프로그램의 특성상 줄 단위 인터 프리터 방식으로 명령을 실행하여 에러검출 등을 시행하였다. 추출된 텍스트에 KoNLP, wordcloud, stringr, arules, igraph, arulesViz 등의 패키지를 이용하여 명사 추출, 불용어 제거, 시각화, 연관도 추출, 연관분석 시각화 등을 시행하였으며, 최종적으로 연관규칙을 통해 한 문장에서 포함된 메인키워드와 그에 따른 종속키워드 간의 관계를 최종적으로 분석함으로써 최종적인 구문 분석 및 주요 이슈, 시사점 등을 도출하였다.
크롤링 된 데이터는 R studio application을 이용하여 명령을 실행하였으며, 프로그램의 특성상 줄 단위 인터 프리터 방식으로 명령을 실행하여 에러검출 등을 시행하였다. 추출된 텍스트에 KoNLP, wordcloud, stringr, arules, igraph, arulesViz 등의 패키지를 이용하여 명사 추출, 불용어 제거, 시각화, 연관도 추출, 연관분석 시각화 등을 시행하였으며, 최종적으로 연관규칙을 통해 한 문장에서 포함된 메인키워드와 그에 따른 종속키워드 간의 관계를 최종적으로 분석함으로써 최종적인 구문 분석 및 주요 이슈, 시사점 등을 도출하였다.
대상 데이터
본 연구에서는 대한민국 정부의 민원·참여·제안의 공간인 ‘www.people.go.kr’의 '민원·정책 질의응답‘ 게시판을 크롤인 하여 빅 데이터 분석을 시행하였다.
웹 사이트 국민신문고(www.people.go.kr)의 ‘민원· 제안·참여’ 카테고리의 ‘민원․정책 질의응답’ 게시판의 항목을 웹크롤러를 이용하여 크롤링 하였으며, 기간은 2017년 05월 7일에서 2018년도 05월 7일, 기관은 중앙행 정기관으로 ‘고용노동부’를 선택하여 전체 민원을 추출하였다.
이에 추출된 항목은 총 584개의 민원이었으며, 이를 텍스트 파일의 형태인 유니코드로 저장하여 소스 데이터로 사용하였다.
데이터처리
kr’의 '민원·정책 질의응답‘ 게시판을 크롤인 하여 빅 데이터 분석을 시행하였다. 이는 고용노동부 사업에서 국민들이 판단하는 애로사항 및 정책제안사항 등의 주요한 이슈를 파악하기 위함이며, 2017년 5월7일 부터 2018년 5월 6일까지의 1년간의 민원 및 정책에 대한 질의 내용을 상용화된 빅데이터 툴인 R프로그래밍을 이용하여 분석하였다. R은 오픈소스이며 완전 무료이다.
이론/모형
손님의 장바구니 품목간의 마케팅 효과를 알아보는 데서 유래한 분석으로 장바구니 분석(market basket analysis)라고도 한다. 연관분석의 알고리즘으로 R프로그램의 Apriori 알고리즘을 이용 하여 연관관계를 분석하였다. Apriori 알고리즘은 연관규칙 분석을 해 사용되는데, 사건 A가 일어났을 때, 사건 B가 일어날 확률을 나타내는 것으로 사건 A와 사건 B 사이에 연계에 한 규칙을 찾는 것을 목표로 한다 (곽철완, 2013)[15].
성능/효과
R Studio를 통해서 유의한 키워드를 추출한 결과 총 2397개의 키워드가 추출되었으며 이중 상위 빈도를 차지한 키워드는 퇴직금(72), 급여(71), 수당(69), 안전(64), 연차(56), 사용(55), 가능(49), 실업(48), 관리(47), 신청(39), 지급(36), 근로자(35), 육아휴직(31) 로 나타났다.
5로 가장 높은 연관성을 보여주고 있다. 각 지표에서 볼 수 있듯이 고용노동부의 최근 정책 중 최저임금, 퇴직금, 재취업 및 실업수당, 출산 및 육아휴직, 주휴수당, 안전관리 등에 대한 민원이 다수를 차지했으며, 특히, 임금과 관련된 민원이 가장 많은 비율을 차지함으로써 여전히 복잡한 임금구조 및 사용자 및 근로자의 근로기준 미숙지 등으로 인한 민원이 많았다.
분석 결과를 통해서 한국기업의 99%를 차지하는 중소 기업 등에서 퇴직금 및 임금 지급 관련 분쟁 및 임금 미 지급 등의 사안이 잦은 것으로 추정되며, 근로기준법에 정한 연장근로수당, 휴일근로수당 등에 주로 임금과 관련된 질의가 상대적으로 많았다. 이외에도 실업급여, 육아휴직 등의 이슈가 많았는데, 종합적으로 볼 때 WLB(Work & Life Balance) 및 YOLO(you only live once)가 고용노동 부문에도 반영된 것으로 추정되며, 근로시간 단축, 인플레이션으로 인한 임금 상승압력, 고노동 전문직 기피현상 복지(well-being) 에 대한 여가의 가치인식 변화를 그대로 반영하고 있다.
연관분석 자료를 기준으로 ‘재취업’ 키워드와 ‘수당’ 키워드는 지지도 0.01, 신뢰도 1.0, 향상도 8.46으로 로 매우 높은 연관성을 보여주고 있으며, ‘중간’, ‘퇴직금’ 키워드의 경우에도 지지도 0.01, 신뢰도 1.0, 향상도 8.11로 높은 관련성이 있으며, 2018년도 최저임금 관련 포함여부를 그대로 반영하는 ‘최저임금‘ 키워드와 ’포함‘ 키워드의 경 우 신뢰도 0.09, 향상도 23.5로 가장 높은 연관성을 보여주고 있다.
후속연구
넷째 심각한 인구 감소 및 인구절벽을 경험하고 있는 한국의 혼인 및 출산의 장려를 위해서는 일 가정 병행을 효과적으로 할 수 있는 제도적 뒷받침이 필수적이라 할 수 있으며, 그에 따른 각종 지원제도가 현실화 되어야 할 것이다.
둘째, 2018년 노사 간 가장 큰 이슈 중에 하나인 최저 임금의 경우 자영업자의 경제적 사정, 물가인상, 청년 실업 등 다양한 측면에서 고려되어야 함에도 불구하고 미흡한 부분을 그대로 드러내고 있어 이에 따른 개선이 필요할 것으로 판단된다.
셋째 또한 생산직, 제조업 등 여전히 산업안전의 사각 지대에 있는 근로자들의 안전교육 및 산업재해 등에 대한 효과적인 대책 및 안전근로를 위한 방편을 모색해야 할 것이다.
국민의 여론을 수렴하고 국민의 고충을 처리하는 국민신문고의 고용노동부 관련 민원·정책에 대한 분석결과 아래와 같은 결론을 도출할 수 있었다. 첫째, 퇴직금, 최저임금, 연장근로 및 야간근로, 휴일근로에 대한 임금 개념의 불일치로 인한 잦은 민원이 발생하고 있으며, 이로 인해 노사 간의 분쟁이 심화되고 있는 것으로 추정되며, 근로기준법 의 정부차원의 다각화된 홍보 및 임금체계의 원활한 이해를 위한 개편 등이 필요할 것으로 판단 된다.
질의응답
핵심어
질문
논문에서 추출한 답변
텍스트 마이닝(Text-Mining)은 어떻게 가치 있는 정보를 도출하는가?
텍스트 마이닝(Text-Mining)은 텍스트 형태의 인터넷 등 온라인상 에 등재된 게시글 또는 댓글 등의 비정형 데이터에서 연구자가 원하는 정보만을 추출하여 사용하는 것으로 키워드가 아닌 맥락 수에서 의미 있는 데이터를 분석하고 가치 있는 정보를 도출한다. 이 과정에서 자연어 처리 기술과 형태소 분석 기술을 사용하며 빈도와 확률 분석을 통해 핵심 단어를 추출하며, 이러 한 텍스트 마이닝은 정보 검색, 정보 추출, 텍스트 범주화, 텍스트 군집화, 텍스트 요약, 기계 학습, 통계학, 자연어 처리, 데이터 마이닝 등 다양한 분야에서 사용되고 있다.
고용노동부는 어떤 사무를 관장해오고 있나?
고용노동부는 현재 대한민국 국민의 근로조건, 직업안정, 직업훈련, 실업대책, 고용보험, 근로자 복지후생, 노사 관계 조정 등 노동에 관한 사무를 관장해오고 있으며, 특히 국민의 소득보장과 고용지원 정책이 주요한 사업을 이루고 있다.(이미화, 2015)[1].
고용노동부의 상세한 업무는 무엇인가?
(이미화, 2015)[1]. 상세한 업무로 고용 및 고용보험 정책, 직업능력개발훈련 정책, 고용평등과 일·가 정의 양립 지원, 근로조건의 기준과 관련된 정책, 근로자의 복지후생, 노사관계 및 노사협력, 산업안전보건 정책, 산업재해보상보험 등이다.
참고문헌 (16)
M. W. Lee. (2015). The Character of Job Creation Program in Social Services : from the Perspective of Adult Worker Model. The Korea Association the public management, 29(3). 87-121.
J. Y. Yoo. (2016). Study on the Money-relating Frustration among Local College Students in Convergence Era : Comparison between Local College Students and Seoul-located College Students. The Society of Digital Policy & Management, 14(1). 43-52.
J. G. Lee, G. H. Kim, L. J. Yoon & S. H. Lim (2012). Vocational Training Study on the Impact on Organizational Commitment -Focusing Certification of Qualification-. The Society of Digital Policy & Management, 10(7). 22-29.
S. G. Kim & J. H. Kim (2016). A Study on the Effect of Cooperative Industrial Relations on Trust and Commitment. The Society of Digital Policy & Management, 14(8). 137-150.
K. H. Choi & J. A. Yu (2015). A reviews on the social network analysis using R. Korea Convergence Society, 6(1). 77-83.
C. N. Jun & I. W. Su. (2013). A Study on the Application of Technology Marketing for Big Data Analysis. Marketing Bulletin, 21(2), 181-203.
H. J. Moon, S. H. Choi & Y. C. Hwang. (2013). Effective Countermeasure to APT Attacks using Big Data. Convergence Society for SMB, 6(1), 17-23.
Y. B. Jo, S. H. Woo & S. H. Lee. (2013). In Small and Medium Business the Government 3.0-based Big Data Utilization Policy. Convergence Society for SMB, 3(1), 15-22.
J. D. Lee, M. G. Lee & M. R. Kim. (2018). Experiencing with Splunk, a Platform for Analyzing Machine Data, for Improving Recruitment Support Services in WorldJob+. The Society of Digital Policy & Management, 3(1), 15-22.
J. G. Chae. (2015). A Study on the Use of Big Data Analysis Techniques in Aviation Safety Field. Master dissertation, IW University, Seoul
G. W. Jun. (2018). A Study on the Effects of Online Word-of-Mouth on Game Consumers Based on Sentimental Analysis. The Society of Digital Policy & Management, 16(3), 145-156.
J. Y. Kim. (2017). Ae-Learning Course Reviews Analysis based on Big Data Analytics. Korea Institute of Information and Communication Engineering, 21(2), 423-428.
H, J. Kim. J. Y. Lee & S. S. Sin. (2017). Multi-threaded Web Crawling Design using Queues. Convergence Society for SMB, 7(2), 43-51.
Y, H. No. (2015). Visual interpretation for the association rules of big data. Master dissertation, BS University, Busan
C, W. Guack. (2013). Subject Association Analysis of Big Data Studies: Using Co-citation Networks. Korea society for information management, 35(1). 13-31.
Y, M. Jang. (2013). A Study on Labor Market Policy according Wage and Labor time in the Korea. Convergence Society for SMB, 3(1), 7-13.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.