경제가 성장하고 인터넷이 발전되면서 사람들의 경제형태와 소비는 많이 바뀌었다. 중국 알리바바 그룹은 모바일, 온라인, 오프라인, 인공지능을 결합한 플랫폼으로 약 28조의 매출을 창출하고 있다. 이는 1초에 약 25만건을 처리하는 수준이며, 2016년 대비 40% 증가했다. 이를 가능하게 한 핵심 기술은 소위 Data Technology라고 불리는 빅데이터와 클라우드 컴퓨팅이 융합된 기술이다. 기술의 발전속도에 비해 Data Technology에 관한 정확한 개념적 정의는 부족하다. 이에 본 논문은 빅데이터 분석기법인 TexTom을 활용하여 구글과 네이버의 최근 3개년(2015년 11월~2018년 11월) 신문기사를 데이터 마이닝 및 정제하여 'Data Technology' 키워드로 한정하여 관련 핵심 키워드를 도출하였다. 그 결과 빅데이터, O2O, 인공지능, 사물인터넷, 클라우드 컴퓨팅의 핵심 키워드 기술이 Data Technology와 관계가 있음을 알수 있었다. 본 연구의 분석결과는 향후 Data Technology 시대가 도래되면 참고할 수 있는 유용한 정보로 활용될 수 있다.
경제가 성장하고 인터넷이 발전되면서 사람들의 경제형태와 소비는 많이 바뀌었다. 중국 알리바바 그룹은 모바일, 온라인, 오프라인, 인공지능을 결합한 플랫폼으로 약 28조의 매출을 창출하고 있다. 이는 1초에 약 25만건을 처리하는 수준이며, 2016년 대비 40% 증가했다. 이를 가능하게 한 핵심 기술은 소위 Data Technology라고 불리는 빅데이터와 클라우드 컴퓨팅이 융합된 기술이다. 기술의 발전속도에 비해 Data Technology에 관한 정확한 개념적 정의는 부족하다. 이에 본 논문은 빅데이터 분석기법인 TexTom을 활용하여 구글과 네이버의 최근 3개년(2015년 11월~2018년 11월) 신문기사를 데이터 마이닝 및 정제하여 'Data Technology' 키워드로 한정하여 관련 핵심 키워드를 도출하였다. 그 결과 빅데이터, O2O, 인공지능, 사물인터넷, 클라우드 컴퓨팅의 핵심 키워드 기술이 Data Technology와 관계가 있음을 알수 있었다. 본 연구의 분석결과는 향후 Data Technology 시대가 도래되면 참고할 수 있는 유용한 정보로 활용될 수 있다.
With the advent of the Internet-based economy, the dramatic changes in consumption patterns have been witnessed during the last decades. The seminal change has led by Data Technology, the integrated platform of mobile, online, offline and artificial intelligence, which remained unchallenged. In this...
With the advent of the Internet-based economy, the dramatic changes in consumption patterns have been witnessed during the last decades. The seminal change has led by Data Technology, the integrated platform of mobile, online, offline and artificial intelligence, which remained unchallenged. In this paper, I use data analysis tool (TexTom) in order to articulate the definitfite notion of data technology from Internet sources. The data source is collected for last three years (November 2015 ~ November 2018) from Google and Naver. And I have derived several key keywords related to 'Data Technology'. As a result, it was found that the key keyword technologies of Big Data, O2O (Offline-to-Online), AI, IoT (Internet of things), and cloud computing are related to Data Technology. The results of this study can be used as useful information that can be referred to when the Data Technology age comes.
With the advent of the Internet-based economy, the dramatic changes in consumption patterns have been witnessed during the last decades. The seminal change has led by Data Technology, the integrated platform of mobile, online, offline and artificial intelligence, which remained unchallenged. In this paper, I use data analysis tool (TexTom) in order to articulate the definitfite notion of data technology from Internet sources. The data source is collected for last three years (November 2015 ~ November 2018) from Google and Naver. And I have derived several key keywords related to 'Data Technology'. As a result, it was found that the key keyword technologies of Big Data, O2O (Offline-to-Online), AI, IoT (Internet of things), and cloud computing are related to Data Technology. The results of this study can be used as useful information that can be referred to when the Data Technology age comes.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
아울러, 국가 과학기술정보인프라의 발전과 운영을 책임지고 있는 한국과학기술정보연구원에서도 ‘2015년 미래과학기술 정보 정책과 전략 연구 및 KISTI 성과확산 기반구축’ 연구를 통해 DT시대의 기관 발전 방안과 환경변화를 제시하였다(한국과학기술정보연구원, 2015). 이 보고서에서는 기존 IT의 의미적 한계를 넘어 데이터 중심의 주도적 역할 변화를 내세우고, 국가 및 사회적 기여측면에서 기관의 전략적 대응의 필요성을 도출하였다.
이에 본 논문에서는 구글과 네이버 뉴스 기사에서 언급된 ‘Data Technology’ 키워드가 실제 문헌에서 언급된 빅데이터 기술등과 연관성이 있는지 보고자 하였다.
제안 방법
첫째, 빅데이터로 과거 데이터는 미개발의 영역이었다면 인공지능의 발달로 데이터를 효율 적으로 가공할 수 있는 기술이 진보해 거대한 규모의 데이터에서 유의미한 정보, 지식, 인사이트를 뽑아낼 수 있게 되었다. 데이터의 효율적 분석은 인간의 행동패턴을 예측하는 것을 넘어 행동패턴을 조정할 수 있는 방법을 알려준다. 데이터를 가장 효율적으로 분석하고 가공하는 방법은 기계에게 인간의 합리성을 장착시키는 것이다.
, 2005). 따라서 본 분석에서는 텍스톰을 활용하여 텍스트의 핵심단어를 추출한 후에 매트릭스를 구성 하였다.
텍스톰은 수집된 데이터 중 연구의 주제와 맞지 않는 데이터의 삭제가 가능하며, 같은 의미 의 단어를 정리하는 정제화를 수행한다(김해원・전채남, 2014). 본 논문에 에서는 수집된 데이터 에서 Data Technology와 관련 없는 단어를 정제하였다.
아울러, 구글 및 네이버의 뉴스 검색에 앞서 국내 주요 언론사를 포함한 방송국의 거시적 트렌드를 검토하기 위해, Data Technology 관련 3개년의 추이(빅카인즈, Bigkinds(2019))를 살펴보았다.
여기서는 빅데이터 분석기법인 TexTom을 활용하여 구글과 네이버의 최근 3개년(2015년 11월~2018년 11월) 신문기사를 데이터 마이닝 및 정제하여 ‘Data Technology’ 키워드로 한정하여 관련 핵심 키워드를 도출할 것이다.
다만, ‘제4차 산업혁명의 현재와 미래’라는 주제로 키워드 네트워크 분석을 수행한 연구는 존재한다(양현채, 2017). 여기서는 사회적으로 논의가 증가하고 있고 이슈화 되고 있으나 일반적 담론에서 머무르고 있는 제4차 산업혁명과 관련한 내용들이 인터넷 사용자들 사이에서 어떤 관련성으로 논의 되었는지 키워드 네트워크를 통해 분석하였다. 또한, 조성환(2018)은 키워드 네트워크 분석에 사용되는 텍스트마이닝과 의 미연결망 분석 방법을 활용하여 블록체인의 산업활용분야로 언론 및 정부발표에서 언급되고 있는 ‘금융’, ‘에너지’, ‘물류’를 언급한 기사들을 비교 분석하였다.
분석채널 은 “뉴스”로 선정하였으며, 자료검색을 위한 키워드는 ‘Data Technology’로 한정하였다. 전체 네트워크에서 중요한 역할을 할 수 있는 노드만을 사용하여 간략화하기 위해 상위 30개의 키워드를 중심으로 데이터의 노이즈 값을 조정하였다.
좀 더 구체적으로 국내・외의 현황을 확인하기 위해 앞서 설명한 바와 같이 텍스톰을 이용한 분석을 진행하였다. 텍스트마이닝은 Feldman and Dagan(1995)이 처음 언급하였으며, 텍스트 를 바탕으로 데이터베이스에서 나온 언어를 기반으로 기존에 알려지지 않은 패턴과 다양한 지 식, 새로운 정보를 얻을 수 있는 분석기술이다(Hotho et al.
대상 데이터
본 논문에서 사용한 최근 3년 동안의 구글과 네이버를 통해 수집된 뉴스의 데이터양과 수집량 은 구글은 4,989,000건과 1,024건이고, 네이버는 6,022건과 6,142건이다
본 논문에서는 Big Data를 통한 국내・외 트렌드 및 핵심 키워드 확인을 위해 텍스톰(Textom) 을 활용하며, 구글(Google)과 네이버(Naver)의 최근 3개년(2015년 11월 ~ 2018년 11월) 신문 기사를 데이터 마이닝 및 정제하여 결과를 확인 하였다
본 논문은 빅데이터 분석기법인 TexTom을 활용하여 구글과 네이버의 2015년 11월부터 2018 년 11월까지 신문기사를 데이터 마이닝 및 정제하여 마윈이 주장하고 있는 Data Technology 키워드로 한정하여 관련 핵심 키워드를 도출하였다. 그 결과, 기존 문헌에서 설명하고 있는 것처럼, 빅데이터, O2O, 인공지능, 사물인터넷, 클라우드 컴퓨팅의 핵심 키워드 기술이 Data Technology와 관계가 있음을 알 수 있었다.
분석채널 은 “뉴스”로 선정하였으며, 자료검색을 위한 키워드는 ‘Data Technology’로 한정하였다.
자료의 분석기간은 2015년 11월부터 2018년 11월까지로 설정하였으며, 이는 마윈 회장의 데이터 테크놀로지 발언 이후로 관련 기사 및 뉴스가 대부분 생성된 현실을 감안 하였다.
성능/효과
관계도 분석의 총괄 를 살펴보면 검색 결과로 Data Technology는 제4차 산업혁명 의 키워드를 중심으로 구글과 미국 중심의 키워드 형성이 연결되어 있는 것을 확인할 수 있다.
본 논문은 빅데이터 분석기법인 TexTom을 활용하여 구글과 네이버의 2015년 11월부터 2018 년 11월까지 신문기사를 데이터 마이닝 및 정제하여 마윈이 주장하고 있는 Data Technology 키워드로 한정하여 관련 핵심 키워드를 도출하였다. 그 결과, 기존 문헌에서 설명하고 있는 것처럼, 빅데이터, O2O, 인공지능, 사물인터넷, 클라우드 컴퓨팅의 핵심 키워드 기술이 Data Technology와 관계가 있음을 알 수 있었다.
동일한 검색 결과를 활용한 키워드 트렌드를 살펴보면 검색기간인 2015년 11월 ~ 2018년 11월까지의 기사건수로 살펴보면 2017년 10월에 급격히 기사의 양이 증가하고, 언론의 관심이 높아지는 것을 에서 확인할 수 있다.
둘째, O2O(Online to Offline)는 오프라인의 모든 서비스가 온라인으로 빨려 들어가는 현상 이며 모바일 기기들이 오프라인에 대한 리모컨이 되어가는 현상이다. O2O는 중국에서 우버, 에어비앤비를 지칭하면서 사용한 용어지만, 본질적으로는 온디맨드(On Demand)를 지칭한다고 볼 수 있다.
그리고 인물로는 잭웰치와 김정한, 마윈 등이 다빈도 키워드로 등장하였고, 기관으로는 구글과 애플, KT 등의 빈도 값이 높음을 알 수 있다. 마지막으로 장소로는 미국, 중국, 일본, 독일 등이 빈도 값이 높음을 확인 할 수 있다.
본 논문에서는 국내 검색점유율 1위를 차지하는 네이버와 전 세계 1위의 검색사이트인 구글을 이용하였으며, 두 사이트는 뉴스 데이터마이닝에 가장 적합한 것으로 판단하였다. 분석채널 은 “뉴스”로 선정하였으며, 자료검색을 위한 키워드는 ‘Data Technology’로 한정하였다.
셋째, 인공지능(Artificial Intelligence, AI)은 데이터-정보-지식-인사이트의 데이터 정제작업 을 사람의 손이 필요 없이 기계가 스스로 할 수 있게 되었다. 스스로 판단하고, 스스로 예측하며, 사람의 판단을 유도하는 단계까지 진화해나가고 있다.
첫째, 빅데이터로 과거 데이터는 미개발의 영역이었다면 인공지능의 발달로 데이터를 효율 적으로 가공할 수 있는 기술이 진보해 거대한 규모의 데이터에서 유의미한 정보, 지식, 인사이트를 뽑아낼 수 있게 되었다. 데이터의 효율적 분석은 인간의 행동패턴을 예측하는 것을 넘어 행동패턴을 조정할 수 있는 방법을 알려준다.
후속연구
본 논문을 통해 향후 Data Technology와 관련하여 주력해야 할 핵심기술 키워드를 도출하 였으며, 향후 데이터 경제에 대한 산업의 방향에 참고자료로 사용될 수 있을 것으로 판단된다. 그러나 본 논문은 소셜 네트워크 분석을 위해 연결정도 중심성, 매개중심성, 군집계수, 포괄성 등 다양한 지표가 있는데 사용하지 않았고, Data Technology 키워드 추출을 구글과 네이버의 기사내용으로만 한정하여 사용한 한계점이 있다. 이에 추후 후속연구에서는 위의 다양한 지표 를 논문이나 특허로 확대하여 분석한다면 의미 있는 연구가 될 수 있을 것이라 생각한다.
빅데이터 분석을 잘하고 있는 해외 글로벌 기업들은 빅데이터 분석을 외부에 의뢰하기 보다는 데이터 과학자 조직을 구성하고 있는 추세이다. 따라서 정부의 적극적인 빅데이터 분석 인재 양성을 통해 한국 국내 빅데이터 시장의 활성화뿐만 아니라 중국 등과 같이 DT시대 신흥시장도 미리 선점해야 할 것이다
본 논문을 통해 향후 Data Technology와 관련하여 주력해야 할 핵심기술 키워드를 도출하 였으며, 향후 데이터 경제에 대한 산업의 방향에 참고자료로 사용될 수 있을 것으로 판단된다. 그러나 본 논문은 소셜 네트워크 분석을 위해 연결정도 중심성, 매개중심성, 군집계수, 포괄성 등 다양한 지표가 있는데 사용하지 않았고, Data Technology 키워드 추출을 구글과 네이버의 기사내용으로만 한정하여 사용한 한계점이 있다.
그러나 본 논문은 소셜 네트워크 분석을 위해 연결정도 중심성, 매개중심성, 군집계수, 포괄성 등 다양한 지표가 있는데 사용하지 않았고, Data Technology 키워드 추출을 구글과 네이버의 기사내용으로만 한정하여 사용한 한계점이 있다. 이에 추후 후속연구에서는 위의 다양한 지표 를 논문이나 특허로 확대하여 분석한다면 의미 있는 연구가 될 수 있을 것이라 생각한다.
질의응답
핵심어
질문
논문에서 추출한 답변
빅데이터 역량을 키우기 위해서 필요한 것은?
빅데이터 역량은 곧 데이터 분석 과학자의 확보 문제와 직결된다. 빅데이터의 숨겨진 가치를 찾아내고 의미 있는 통찰력을 제시할 수 있는 인재를 육성시켜야 한다. 빅데이터 분석을 잘하고 있는 해외 글로벌 기업들은 빅데이터 분석을 외부에 의뢰하기 보다는 데이터 과학자 조직을 구성하고 있는 추세이다.
제4차 산업혁명의 핵심은 무엇입니까?
OECD 국민 1인당 산업부가가치 순위는 2016년 18위에서 2022년 12위로 과학기술과 정보통신기반 일자리 창출은 2022년까지 26만개를 창출하는 계획 을 세웠다(과학기술정보통신부, 2018). 제4차 산업혁명의 핵심은 사물인터넷, 인공지능, 3차원 인쇄, 로봇공학, 나노기술, 무인운송수단과 같은 6대 분야에서 혁신을 추진하고 있다. 제4차 산업혁명은 디지털, 생물학적, 물리적 세계를 빅데이터 활용으로 통합시키고 산업・경제 등 전 분야에 영향을 미치는 새로운 기술이다.
빅데이터가 가지고있는 특징들은?
빅데이터는 규모(volume), 다양성(variety), 속도(velocity)의 특징을 가지고 있다. 여기서, 3V는 빅데이터의 핵심적인 특징을 포함하고 있지만, 기업들이 정확성(veracity)이라는 네 번째 중요한 차원을 하나 더 고려하여 추가한 특징을 일반적으로 로 통용하고 있다(IBM 비지 니스가치연구소, 2012).
※ AI-Helper는 부적절한 답변을 할 수 있습니다.