최근 과학기술정보 콘텐츠 분석 기반의 R&D 전략 수립이 중요시됨에 따라 국내 외 과학기술 통계 정보를 수집, 범주화하여 DB를 구축하고 이를 증거 기반의 기초연구정책을 수립하는데 활용하고자 하였다. 국내 외 49종의 과학기술 관련 보고서 등 자료를 수집하여 6,446개 지표 추출, 877개 통계 정보로 범주화, 이중 208개를 집중 관리 통계로 도출하였다. 이렇게 구축된 DB의 활용성 제시를 위해 논문정보 관련 심층분석을 통해 제한적으로나마 우리나라 기초연구의 효과성을 보여주고자 하였다. 이를 위해, 고피인용 논문창출과 R&D 투자 간의 통계기반 분석과 고피인용 논문의 국내 외 지식맵 비교 분석을 실시하였다. 그 결과, 기초연구비 증가가 우리나라의 보편적 연구활동도와 세계적 연구성과 창출에 긍정적 영향을 미친 것으로 나타났다. 또한 순수기초연구분야로 간주되어온 수학, 물리, 화학이 신성장동력이라 불리는 AI, 청정에너지 등 기술 발전의 기반이 되어왔음을 알 수 있었다.
최근 과학기술정보 콘텐츠 분석 기반의 R&D 전략 수립이 중요시됨에 따라 국내 외 과학기술 통계 정보를 수집, 범주화하여 DB를 구축하고 이를 증거 기반의 기초연구정책을 수립하는데 활용하고자 하였다. 국내 외 49종의 과학기술 관련 보고서 등 자료를 수집하여 6,446개 지표 추출, 877개 통계 정보로 범주화, 이중 208개를 집중 관리 통계로 도출하였다. 이렇게 구축된 DB의 활용성 제시를 위해 논문정보 관련 심층분석을 통해 제한적으로나마 우리나라 기초연구의 효과성을 보여주고자 하였다. 이를 위해, 고피인용 논문창출과 R&D 투자 간의 통계기반 분석과 고피인용 논문의 국내 외 지식맵 비교 분석을 실시하였다. 그 결과, 기초연구비 증가가 우리나라의 보편적 연구활동도와 세계적 연구성과 창출에 긍정적 영향을 미친 것으로 나타났다. 또한 순수기초연구분야로 간주되어온 수학, 물리, 화학이 신성장동력이라 불리는 AI, 청정에너지 등 기술 발전의 기반이 되어왔음을 알 수 있었다.
As increasing the importance of the R&D strategy planning based on S&T evidence, the S&T DB was conducted to develop appropriate basic research support strategies by collecting 49 multiple-nations' statistics and information, extracting 6446 raw data, categorizing 877 indicators including 208 core i...
As increasing the importance of the R&D strategy planning based on S&T evidence, the S&T DB was conducted to develop appropriate basic research support strategies by collecting 49 multiple-nations' statistics and information, extracting 6446 raw data, categorizing 877 indicators including 208 core indicators. An statistical and knowledge map analysis using the highly cited publication-related indicators was conducted to examine the expansion of DB utilization by demonstrating effectiveness of Korea's basic research. As a result, basic research investment have a strong influence on creating outstanding R&D outcomes and on producing a foundation of various S&T based-growth engines.
As increasing the importance of the R&D strategy planning based on S&T evidence, the S&T DB was conducted to develop appropriate basic research support strategies by collecting 49 multiple-nations' statistics and information, extracting 6446 raw data, categorizing 877 indicators including 208 core indicators. An statistical and knowledge map analysis using the highly cited publication-related indicators was conducted to examine the expansion of DB utilization by demonstrating effectiveness of Korea's basic research. As a result, basic research investment have a strong influence on creating outstanding R&D outcomes and on producing a foundation of various S&T based-growth engines.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
학술논문 정보 기반의 지식맵을 활용하여 mobile-health, 리튬의 독성 연구, 지역별 핵심연구 트렌드 분석 등 다양한 연구결과가 발표되고 있다[28-30]. 동 연구에서는 학술논문 키워드의 빈도, 점유율의 증가율을 밀도맵과 네트워크맵으로 도출하여 다각적인 측면에서 분석하고자 하였다.
본 연구는 기초연구정책과 같은 국가 과학기술과 관련한 정책수립을 지원하기 위해 활용도가 높은 과학기술 통계·정보와 관련한 DB를 체계적이고 포괄적으로 구축하고자 하였다.
본 연구에서는 증거기반의 국가 기초연구지원을 위한 정책을 수립하는데 활용하고자 핵심적이고 활용도가 높은 과학기술 통계·정보를 포괄적으로 수록한 DB를 구축하고자 하였다.
다양한 스케일과 차원의 통계· 정보를 통합적으로 수집하여 즉시 활용가능한 통계표 형태로 구축함으로써 정책결정자 등의 합리적 판단과 효율적인 재원 배분을 지원하는데 효과적으로 활용될 수 있을 것으로 기대된다. 이렇게 구축된 DB의 활용성 제시를 위해 논문정보 관련 심층분석을 통해 제한적으로나마 우리나라 기초연구의 효과성을 보여주고자 하였다. 학술논문은 기초연구의 대표적인 결과물로서 기초연구 수행의 핵심주체인 대학의 지식 확산의 대표적인 채널이기도 하다.
이렇게 구축된 과학기술 통계·정보 DB의 구체적인 활용방안을 제시하기 위해 기초연구의 대표적 성과로 간주되는 학술논문 성과와 관련한 심층 분석 사례 연구를 수행하였으며 이를 통해 우리나라 기초연구 투자의 효과성을 제한적으로나마 보여주고자 하였다.
이에, 동 연구에서는 과학기술 통계·정보 DB에 구축된 학술논문과 관련한 시계열 통계·정보의 다각적인 심층분석을 통해 DB의 효과적인 활용방안을 제시하고자 하였다.
지속적인 통계·정보 DB의 현행화와 함께 활용성, 개방성, 접근성 제고를 위한 방안을 모색하고자 한다.
8%가 산업특허(commercial patent)에 인용되었음을 밝혔다[8]. 직접적인 상업적 가치 창출보다는 시장의 성숙 등 지속적인 환경변화에 따라 예상치 않은 효과를 창출할 수 있는 기초연구의 장기적 효과성을 제시하고자 한 것이다[8]. 국외 사례와 같이 우리나라도 연구개발 투자 효과, 특별히 기초연구와 같이 직접적인 경제적 가치를 증명하기 어려운 R&D 투자에 대한 객관적인 효과성 분석이 필요할 것이다.
최근 연구개발비 절대투자금액과 투자비중 간의 중요도에 대한 이슈가 회자되고 있어 추가적으로 기초연구비 절대투자금액과 기초연구비 투자 비중(총연구개 발비 중 비중) 중 피인용 상위 1% 논문 성과 창출에 더 큰 영향을 미치는 변수가 무엇인지 확인하고자 하였다. 이를 위하여 중다회귀분석을 실시하였고 기초연구비와 기초연구비 투자 비중을 독립변수로 피인용 상위 1% 논문수를 측정하는 모형에서 기초연구비가 더 영향을 주는 변수로 나타났으며(R 2 =.
가설 설정
• 보편적 연구활동도(SCI 논문수) 증대가 세계적 연구성과 창출에 영향을 미쳤을 것이다.
• 연구비 증가가 우리나라의 보편적 연구활동도(SCI 논문수) 증대와 세계적 연구성과 창출에 영향을 미쳤을 것이다.
제안 방법
1차 범주화를 통해 5개 그룹(① 국가, ② 대학,③ 정부연구소, ④ 산업계, ⑤연구재단), 2차 범주화를 통해 4개 그룹(① 예산투입, ② 인력투입, ③ 프로세스,④ 산출), 3차 범주화를 통해 2개 그룹(① 국내 통계·정보, ② 국제 통계·정보), 4차 범주화를 통해 산출에 한하여 5개 그룹(① 논문, ② 특허, ③ 기술료, ④ 사업화/창 업, ⑤ 기타)으로 분류하였다.
수집된 자료별로 제공기간은 다양하나 최대 1999년부터 2016년까지 정보를 취합하였다. 2단계로 수집된 49종의 자료로부터 6446개의 개별 지표를 추출하였고 수집된 자료의 구조와 특성 분석을 기반으로 계층화된 범주화 체계를 도출 하였다. 1차 범주화를 통해 5개 그룹(① 국가, ② 대학,③ 정부연구소, ④ 산업계, ⑤연구재단), 2차 범주화를 통해 4개 그룹(① 예산투입, ② 인력투입, ③ 프로세스,④ 산출), 3차 범주화를 통해 2개 그룹(① 국내 통계·정보, ② 국제 통계·정보), 4차 범주화를 통해 산출에 한하여 5개 그룹(① 논문, ② 특허, ③ 기술료, ④ 사업화/창 업, ⑤ 기타)으로 분류하였다.
3개 기초연구분야 지식맵 구축을 위해 저자키워드와 인덱스키워드를 활용하였고 중요 트렌드 강조를 위해 분야별 특성(논문수 등)을 고려한 논문 출현 빈도 기반의 임계값(cut-off)을 설정하였다. 연구분야별 키워드의 시계열 분석을 위해 전세계의 해당분야별 피인용 상위 1% 논문의 키워드를 3개 주기로 나누어 키워드 밀도 맵을 도출하고 10년 전·후 트렌드를 비교하였다(주 기1: 2006-2009, 주기2: 2009-2012, 주기3: 2012-2015).
과학기술 통계·정보 DB 구축은 1단계 데이터 수집 (연구재단 등 국내 기관 보유자료, 국외 자료), 2단계 지표 추출 및 데이터 범주화·코드화, 3단계 DB 구축·활용으로 진행되었다.
과학기술 통계·정보 DB로 구축된 정보를 활용하여 대표적 기초연구분야인 수학, 물리, 화학 분야의 고피인용된 학술논문 키워드 기반의 분석을 통해 시계열적 연구동향과 시사점을 도출하였다.
우수한 학술논문 창출은 연구개발의 성과, 특별히 기초연구의 대표적인 성과로 간주되어 오고 있다. 기초연구 투자가 우리나라의 세계적인 연구성과 창출에 미치는 영향과 가장 주요한 요인을 판별하여 그 효과성을 보여주고자 가설을 수립하고 통계적 검증을 실시하였다. 과학기술 통계·정보 DB로 구축된 최근 15년(2000년~2015년) 간 우리나라의 다양한 주체별 연구개발 투자와 고피인용 SCI 논문(1%, 0.
또한 연구분야별 떠오르고 있거나 지속적으로 강한 세부분야의 파악과 전세계와 한국의 트렌드를 비교·분석하기 위해 10년간 키워드의 빈도 및 점유율의 증가율 맵을 전세계(한국 포함)와 한국 맵으로 나누어 분석하였다.
그 결과 기초연구비와 정부연구개발비가 순차적으로 선택되었는데 이 경우 독립변수의 다공선성 (multicollinearity)을 진단하는 통계량인 분산팽창지수 (variance inflation factor; VIF)가 49로 산출(>10의 경우, 다공선성이 매우 높다고 판단하여 모형을 신뢰하기 어려움)되어 두 개의 지표변수가 모두 모형에 투입되는 것은 적절하지 않은 것으로 판단하였다[33]. 모형의 전반적인 적절성을 결정계수 R2 , F값과 유의확률로 확인한 후, 독립변수의 상대적 기여도를 나타내는 표준화계 수(beta), t값과 유의확률로 독립변수의 효과를 확인하였다. 그 결과 SCI 피인용 상위 1% 논문 성과 창출에 기초연구비가 가장 큰 영향을 미친 것으로 나타났다 (t=52.
학술논문의 경우, 저자 키워드와 색인어 등 구조화된 문서의 대표 단어들이 존재하고 직관적으로 이해할 수 있는 동시출현 관계와 빈도에 기반한 co-wording mapping을 통해 연구 트렌드를 도출하고 있다[36]. 본연구에서는 네델란드 Leiden 대학교에서 개발한 계량 서지학적 네트워크 분석과 이를 시각화 해주는 소프트웨어인 VOSviewer를 활용하여 3대 기초연구분야 별지식맵을 구성하는 연구주제가 무엇인지 확인 (clustering)하고, 연구주제 간의 관계를 시각화 (mapping) 하였다. VOSviewer에서 두 단어 간의 유사도는 두 단어가 한 논문에서 동시출현한 횟수에 따라 비례하고, 두 단어가 다른 단어들과 동시 출현한 빈도의 합에 반비례 한다[37].
사례분석은 첫 번째 다양한 연구개발 투자와 연구성과 창출 간 연계성에 관한 통계적 측면의 분석, 두 번째 고피인용(피인용 상위 1%) 논문의 지식맵 트렌드와 국내·외 트렌드 비교·분석을 실시하였다.
연구 트렌드 분석을 위해 키워드 간의 관계를 중심으로 살펴보았다. 일반적으로 텍스트에서 단어들간의 관계를 분석하는 방법은 단어들의 동시출현 관계와 빈도를 중심으로 한 연결망분석(Network Analysis), 단어들의 유사도에 기반한 잠재의미분석(Latent Semantic Analysis), 기계학습과 자연어처리 분야에서 확률 및 통계모형에 기반하여 문서와 단어 집합에서 토픽을 찾는 토픽모델링(Topic Modeling) 등 다양하다[34][35].
연구분야별 키워드의 시계열 분석을 위해 전세계의 해당분야별 피인용 상위 1% 논문의 키워드를 3개 주기로 나누어 키워드 밀도 맵을 도출하고 10년 전·후 트렌드를 비교하였다(주 기1: 2006-2009, 주기2: 2009-2012, 주기3: 2012-2015).
05). 우리나라의 경우 양적성과의 증가에 비해 질적성과가 저조하다는 비판을 검증하고자 양적성과(SCI 논문)와 질적성과(고피인용 논문) 간 연계성 분석을 실시하였다. 피어슨 상관분석 결과 SCI 논문 수 증대와 피인용 1%, 0.
이에 본 연구에서는 국내·외 주요 과학기술 자료를 수집하여 통계지표를 도출하고 체계적인 범주화를 통해 광범위한 과학기술 통계·정보 DB를 구축하였다.
과학기술 통계·정보 DB로 구축된 정보를 활용하여 대표적 기초연구분야인 수학, 물리, 화학 분야의 고피인용된 학술논문 키워드 기반의 분석을 통해 시계열적 연구동향과 시사점을 도출하였다. 최근 10년(2006~2015년) 간 Scopus에 등재된 수학, 물리, 화학 분야의 과학 기술논문 중 피인용 상위 1% 논문의 키워드 밀도와 증가율을 분석하여 지식맵을 구축하고 지식맵에 내제된 연구 트렌드를 분석하였다.
대상 데이터
1단계 데이터 수집을 위해 국내·외 49 종의 과학기술 관련 보고서, DB, 링크 등의 연도별 자료를 on/offline으로 수집하였다.
4단계로 계층화된 체계를 기반으로 877개 통계·정보로 범주화하고 이중 208개를 집중 관리 통계로 도출하였다.
고피인용 SCI 논문 자료는 분석기간에 해당하는 ‘주요국의 피인용 상위 1% 논문실적 비교분석 보고서’에 수록된 자료를 활용하였다[31].
수집된 49종의 자료는 31개의 국내 과학기술 관련 통계·정보와 18개의 국제 과학기술 관련 통계·정보로 구성되었다.
수집된 49종의 자료는 31개의 국내 과학기술 관련 통계·정보와 18개의 국제 과학기술 관련 통계·정보로 구성되었다. 수집된 자료별로 제공기간은 다양하나 최대 1999년부터 2016년까지 정보를 취합하였다. 2단계로 수집된 49종의 자료로부터 6446개의 개별 지표를 추출하였고 수집된 자료의 구조와 특성 분석을 기반으로 계층화된 범주화 체계를 도출 하였다.
이를 위해 국내·외 49종의 과학 기술 관련 보고서 등 자료를 수집하여 6,446개 지표 추출, 877개 통계·정보로 범주화, 이 중 208개를 집중 관리 통계로 도출하였다.
데이터처리
과학기술 통계·정보 DB로 구축된 최근 15년(2000년~2015년) 간 우리나라의 다양한 주체별 연구개발 투자와 고피인용 SCI 논문(1%, 0.1%, 0.01%) 창출 정도의 기술통계분석(descriptive statistics analysis), 피어슨 상관분석((pearson correlation analysis), 회귀분석 (regression analysis)을 설계하였다.
국가총연구개발비, 정부연구개발비, 기초연구비 중피인용 상위 1% 논문 성과 창출에 가장 영향을 미치는 지표변수가 무엇인지를 확인하기 위하여 중다회귀분석을 실시하였다. 변수 선택의 방법으로 단계적 변수선택 (stepwise variable selection)방법을 사용하였고, 입력 변수의 기준값과 제거변수의 기준값은 .
수집된 자료는 SAS9.4를 이용하여 통계분석을 실시하였다[32]. 주요 지표변수들에 대한 기술통계는 평균, 표준편차로 제시하였고 주요 지표변수들 간의 관련성을 분석하기 위해 피어슨 상관분석을 실시하였다.
이에, 동 연구에서는 과학기술 통계·정보 DB에 구축된 학술논문과 관련한 시계열 통계·정보의 다각적인 심층분석을 통해 DB의 효과적인 활용방안을 제시하고자 하였다. 이를 위해 통계 분석(statistical analysis)과 지식맵(knowledge map) 분석을 실시하였다. 연승민 외(2016)는 연구비 투입, 과제 특성(연구원수·연령, 수행기간 등) 등 연구성과에 미치는 영향요인에 관한 광범위한 선행 연구 결과를 제시 하였다[19].
4를 이용하여 통계분석을 실시하였다[32]. 주요 지표변수들에 대한 기술통계는 평균, 표준편차로 제시하였고 주요 지표변수들 간의 관련성을 분석하기 위해 피어슨 상관분석을 실시하였다. 그결과, 연구비 관련 변수(총연구개발비, 정부연구개발비, 기초연구비)들의 증가와 SCI 논문수 증가 및 고피인용 논문 창출(1%, 0.
질적·양적 학술논문 창출 성과와 R&D 투자 간의 통계 기반 분석과 고피인용 논문의 지식맵 분석을 실시하였다.
이론/모형
국가총연구개발비, 정부연구개발비, 기초연구비 중피인용 상위 1% 논문 성과 창출에 가장 영향을 미치는 지표변수가 무엇인지를 확인하기 위하여 중다회귀분석을 실시하였다. 변수 선택의 방법으로 단계적 변수선택 (stepwise variable selection)방법을 사용하였고, 입력 변수의 기준값과 제거변수의 기준값은 .15를 사용하였다. 그 결과 기초연구비와 정부연구개발비가 순차적으로 선택되었는데 이 경우 독립변수의 다공선성 (multicollinearity)을 진단하는 통계량인 분산팽창지수 (variance inflation factor; VIF)가 49로 산출(>10의 경우, 다공선성이 매우 높다고 판단하여 모형을 신뢰하기 어려움)되어 두 개의 지표변수가 모두 모형에 투입되는 것은 적절하지 않은 것으로 판단하였다[33].
한국연구재단은 2000년~2011년을 대상으로 고피인용 SCI 논문 분석을 최초로 추진하여 매년 관련 보고서를 발간하고 있어 분석기간을 최근 16년으로 산정하였다. 우리나라 총연구 개발비, 정부연구개발비, 기초연구비는 OECD MSTI(2017.2.) 자료를 기반으로 하였다[11]. 고피인용 SCI 논문 자료는 분석기간에 해당하는 ‘주요국의 피인용 상위 1% 논문실적 비교분석 보고서’에 수록된 자료를 활용하였다[31].
성능/효과
분석 결과, 수학분야의 경우 초기에는 전통적 수학 키워드 그룹이 강세였고, 이후 인공지능(Artificial Intelligence, AI)의 기반 기술인 다양한 알고리즘 기술 (Evolutionary/Genetic Algorithm, Neural Network)이 부상하였고 바이오 관련하여 고유영역(Genetics, Genomics 등)을 구축하였다. AI는 알고리즘 기술과 바이오 관련 클러스터와 연계되어 있었으며 바이오 관련 영역의 키워드 점유율 증가율이 가장 큰 것으로 나타났다. 기후변화와 관련한 키워드(Climate Change, CO2 등)는 중요도는 상대적으로 낮으나 점유율의 증가율이 커지고 있다.
또한 양적성과(SCI 논문) 와 질적성과(고피인용논문) 간 연계성 분석 결과, 상호 간에 정(+)의 상관관계인 것으로 판별되었다. 국가총 연구개발비, 정부연구개발비, 기초연구비 중 기초연구비가 질적성과(고피인용 논문) 창출에 가장 큰 영향을 미치는 것으로 분석되었다. 이를 통해, 신정부 국정과제 등을 통해 발표된 연구자 주도 기초연구비 2배 확대 정책 추진의 필요성에 대한 한 가지 증거를 제시할 수 있을 것으로 기대된다.
그 결과 SCI 피인용 상위 1% 논문 성과 창출에 기초연구비가 가장 큰 영향을 미친 것으로 나타났다 (t=52.37, p<.05).
그 결과 기초연구비와 정부연구개발비가 순차적으로 선택되었는데 이 경우 독립변수의 다공선성 (multicollinearity)을 진단하는 통계량인 분산팽창지수 (variance inflation factor; VIF)가 49로 산출(>10의 경우, 다공선성이 매우 높다고 판단하여 모형을 신뢰하기 어려움)되어 두 개의 지표변수가 모두 모형에 투입되는 것은 적절하지 않은 것으로 판단하였다[33].
그결과, 연구비 관련 변수(총연구개발비, 정부연구개발비, 기초연구비)들의 증가와 SCI 논문수 증가 및 고피인용 논문 창출(1%, 0.1%, 0.01%)과 상관이 높고(.76~.99) 통계적으로도 유의한 것으로 판별되었다(p<.05).
이를 통해, 신정부 국정과제 등을 통해 발표된 연구자 주도 기초연구비 2배 확대 정책 추진의 필요성에 대한 한 가지 증거를 제시할 수 있을 것으로 기대된다. 두 번째, 지난 10년간의 피인용 상위 1% 논문 기반의 지식맵 트렌드 분석 결과, 순수기초 연구분야로 간주되어온 수학, 물리, 화학이 신성장동력 이라 불리는 AI, 빅데이터 분석, 바이오 관련 기술, 청정에너지 등 기술 발전의 기반이 되어왔음을 알 수 있었다. 물리와 화학 분야의 경우 청정에너지 관련 기술과 신소재 기술이 부상하는 전세계 트렌드와 한국이 유사한 것으로 나타났다.
특별히 신소재기술의 경우 초기에 그래핀 중심에서 반도체, MoS2(그래핀 다음의 차세대 2차원 소재), 페로브스카이트 등 키워드가 다양화되고 고유의 영역을 형성하였다. 또한 10년간의 키워드 점유율 증가율 분석 결과 리튬전지, 태양전지 등과 같은 친환경에너지 관련 키워드가 주요영역으로 분석되었다. 한국은 그래핀, 페로브스카이트, 나노 중심의 신소재, 태양전지 등의 친환경에너지 기술이 주요영역으로 세계적 트렌드와 유사한 것으로 분석되었다.
또한 SCI 논문 수의 논문 피인용 1%에의 효과를 단순회귀분석 (simple linear regression)으로 검정해본 결과 통계적으로 유의한 것으로 나타났다(t=21.6, p<.05).
첫 번째, 학술논문 성과와 연구비 투자 간 관계에 관한 통계 분석 결과, 기초연구비 증가가 우리나라의 보편적 연구활동도(SCI 논문수) 증대와 세계적 연구성과 창출(고피인용 논문)에 모두 영향을 미친 것으로 나타났다. 또한 양적성과(SCI 논문) 와 질적성과(고피인용논문) 간 연계성 분석 결과, 상호 간에 정(+)의 상관관계인 것으로 판별되었다. 국가총 연구개발비, 정부연구개발비, 기초연구비 중 기초연구비가 질적성과(고피인용 논문) 창출에 가장 큰 영향을 미치는 것으로 분석되었다.
분석 결과, 수학분야의 경우 초기에는 전통적 수학 키워드 그룹이 강세였고, 이후 인공지능(Artificial Intelligence, AI)의 기반 기술인 다양한 알고리즘 기술 (Evolutionary/Genetic Algorithm, Neural Network)이 부상하였고 바이오 관련하여 고유영역(Genetics, Genomics 등)을 구축하였다. AI는 알고리즘 기술과 바이오 관련 클러스터와 연계되어 있었으며 바이오 관련 영역의 키워드 점유율 증가율이 가장 큰 것으로 나타났다.
이는 순수기초 연구 외에 기술의 발전, 시장의 성숙 등에 환경변화에 따라 상용화 가가능한 응용기술로의 기술융합이 이루어진 결과로 유추된다. 수학의 경우, 전세계는 다양한 알고리즘 기술의 충분한 성숙과 4차 산업혁명 관련 기술의 발전으로 AI, 바이오 관련 분석기술 등의 부상이 뚜렷한 트렌드로 나났다. 이에 반해, 한국은 전통적인 수학분야가 여전히 강세인 것으로 나타났는데 이는 지식맵 구축의 범위를 피인용 상위 1% 논문에 한정하여 규모는 작으나 점점 증가하고 있는 키워드를 보여주지 못한 것으로 추측된다.
이를 위하여 중다회귀분석을 실시하였고 기초연구비와 기초연구비 투자 비중을 독립변수로 피인용 상위 1% 논문수를 측정하는 모형에서 기초연구비가 더 영향을 주는 변수로 나타났으며(R 2 =.94, t=23.47, p<.05), 기초 연구비 투자 비중이 동시에 포함된 모형(R 2 =.98)과도 큰 차이를 나타내지 않았다.
동 선행연구에 따르면 연구비 투입(정부연구비, 민간연구비)과 연구성과(SCI 논문, 특허) 간 관계를 통계적 모형 검정(상관분석, 회귀분석, 분산분석 등) 을 통해 정의하고자 하였으며, 분석결과 모두 정(+)의 상관관계를 보이는 것으로 나타났으며 연구비 증가가 반드시 연구성과 창출과 정비례하지 않을 수도 있음을 제시하였다[19-23]. 제시된 선행연구 분석 결과를 통해 연구비 투입과 성과창출 간의 관계를 정의하는데 통계적 분석이 효과적인 방법론 중의 하나임을 알 수 있었다. 다만, 선행연구들이 특정사업을 대상으로 분석하였고 연구비 중 정부연구비(민간 매칭 포함)만을 고려하였다는 점에서 기초연구비 투입의 효과성을 제시하는 데는 다소 제한적일 수 있다.
질적·양적 학술논문 창출 성과와 R&D 투자 간의 통계 기반 분석과 고피인용 논문의 지식맵 분석을 실시하였다. 첫 번째, 학술논문 성과와 연구비 투자 간 관계에 관한 통계 분석 결과, 기초연구비 증가가 우리나라의 보편적 연구활동도(SCI 논문수) 증대와 세계적 연구성과 창출(고피인용 논문)에 모두 영향을 미친 것으로 나타났다. 또한 양적성과(SCI 논문) 와 질적성과(고피인용논문) 간 연계성 분석 결과, 상호 간에 정(+)의 상관관계인 것으로 판별되었다.
피어슨 상관분석 결과 SCI 논문 수 증대와 피인용 1%, 0.1%, 0.01% 논문 창출 간에 상관이 높고(.78~.98) 통계 적으로도 유의한 것으로 판별되었다(p<.05).
후속연구
국외 사례와 같이 우리나라도 연구개발 투자 효과, 특별히 기초연구와 같이 직접적인 경제적 가치를 증명하기 어려운 R&D 투자에 대한 객관적인 효과성 분석이 필요할 것이다.
기초연구에 대한 투자가 혁신과 미래를 이끌 중요한 기반적 요소임을 보여 주기 위해서는 다양한 과학기술 통계·정보를 활용한 심층적인 효과성 분석이 지속적으로 필요할 것이다.
다양한 스케일과 차원의 통계· 정보를 통합적으로 수집하여 즉시 활용가능한 통계표 형태로 구축함으로써 정책결정자 등의 합리적 판단과 효율적인 재원 배분을 지원하는데 효과적으로 활용될 수 있을 것으로 기대된다.
이렇게 구축된 DB는 연구관리 전문기관, 부처 등 관계자에 제공하여 증거기반의 정책결정을 지원하고 통계·정보의 심층분석을 통한 이슈도출 등에 활용할 수 있을 것으로 기대된다.
국가총 연구개발비, 정부연구개발비, 기초연구비 중 기초연구비가 질적성과(고피인용 논문) 창출에 가장 큰 영향을 미치는 것으로 분석되었다. 이를 통해, 신정부 국정과제 등을 통해 발표된 연구자 주도 기초연구비 2배 확대 정책 추진의 필요성에 대한 한 가지 증거를 제시할 수 있을 것으로 기대된다. 두 번째, 지난 10년간의 피인용 상위 1% 논문 기반의 지식맵 트렌드 분석 결과, 순수기초 연구분야로 간주되어온 수학, 물리, 화학이 신성장동력 이라 불리는 AI, 빅데이터 분석, 바이오 관련 기술, 청정에너지 등 기술 발전의 기반이 되어왔음을 알 수 있었다.
종합하여 보면, 국내·외 다양한 주체들이 과학기술과 관련한 통계와 정보를 제공하고 있으나 거시적인 정보 제공으로 상세 비교·분석에 제한적이거나, 자국의 정보만을 제공하거나 원문제공으로 상세정보 검색·활용의 편의성이 떨어지는 등의 제한점을 가진다.
향후 동 연구를 통해 구축된 기초연구과제 정보, 기초연구과제 수행을 통해 창출된 성과 정보(논문, 특허 등)를 기반으로 구축한 지식맵의 3P분석(Project, Paper, Patent)을 통해 기초연구비 투자에 대한 효과성에 대한 심층분석이 가능할 것으로 기대된다. 지속적인 통계·정보 DB의 현행화와 함께 활용성, 개방성, 접근성 제고를 위한 방안을 모색하고자 한다.
질의응답
핵심어
질문
논문에서 추출한 답변
NTIS에서 제공하는 서비스는 무엇인가?
KRS[13]와 성과마루[14]는 다차원 기초·원천연구 지원 현황(시계열, 사업별), 성과정보 (정부연구개발사업 과제별 논문·특허 등 성과소개서), 연구자 네트워크, 연구보고서 등을 제공하고 있으나 한국연구재단을 통해 지원된 과제와 관련된 정보만을 제공하고 있다. NTIS[15]의 경우에는 우리나라 국가연구 개발사업 지원 현황, 참여인력 등에 관한 가장 광범위한 정보를 수집·제공하고 있으며 국가연구개발사업조사분석, 국가연구시설장비, 과학기술통계와 관련한 온라인 통계분석 서비스를 제공하고 있다. 그러나 이러한 정보는 국내 현황과 관련된 정보라는 제한점을 가진다.
과학기술 통계·정보 DB 구축은 어떻게 진행되었는가?
과학기술 통계·정보 DB 구축은 1단계 데이터 수집 (연구재단 등 국내 기관 보유자료, 국외 자료), 2단계 지표 추출 및 데이터 범주화·코드화, 3단계 DB 구축·활용으로 진행되었다. 1단계 데이터 수집을 위해 국내·외 49 종의 과학기술 관련 보고서, DB, 링크 등의 연도별 자료를 on/offline으로 수집하였다.
학술논문 성과와 연구비 투자 간 관계에 대한 통계 분석 결과로부터 생각할 수 있는 기대효과는?
국가총 연구개발비, 정부연구개발비, 기초연구비 중 기초연구비가 질적성과(고피인용 논문) 창출에 가장 큰 영향을 미치는 것으로 분석되었다. 이를 통해, 신정부 국정과제 등을 통해 발표된 연구자 주도 기초연구비 2배 확대 정책 추진의 필요성에 대한 한 가지 증거를 제시할 수 있을 것으로 기대된다. 두 번째, 지난 10년간의 피인용 상위 1% 논문 기반의 지식맵 트렌드 분석 결과, 순수기초 연구분야로 간주되어온 수학, 물리, 화학이 신성장동력 이라 불리는 AI, 빅데이터 분석, 바이오 관련 기술, 청정에너지 등 기술 발전의 기반이 되어왔음을 알 수 있었다.
W. M. Sweileh, S. W. Al-Jabi, A. S. AbuTaha, H. Z. Sa'ed, F. M. Anayah, and A. F. Sawalha, "Bibliometric analysis of worldwide scientific literature in mobile-health: 2006-2016," BMC Medical Informatics and Decision Making, Vol.17, No.1, p.72, 2017.
S. E. H. Zyoud, W. S. Waring, W. S. Sweileh, and S. W. Al-Jabi, "Global research trends in lithium toxicity from 1913 to 2015: A bibliometric analysis," Basic & Clinical Pharmacology & Toxicology, 2017.
Z. Hu, F. Guo, and H. Hou, "Mapping research spotlights for different regions in China," Scientometrics, Vol.110, No.2, pp.779-790, 2017.
SAS Institute (2015). Base SAS 9.4 Procedures Guide. SAS Institute.
D. C. Montgomery, E. A. Peck, and G. G. Vining, Introduction to linear regression analysis, John Wiley &Sons, 2012.
L. Leydesdorff, "Science Visualization and Discursive Knowledge," in B. Cronin, and R. Sugimoto, eds. Beyond Bibliometrics: Harnessing Multidimensional Indicators of Scholary Impact, pp.167-185, The MIT Press, 2014.
L. Leydosdorff and A. Nerghes, "Co-word Maps and Topic Modeling: A Comparison Using Small and Medium-Sized Corpora (N< 1,000)," Journal of the Association for Information Science and Technology, Vol.68, No.4, pp.1024-1035, 2017.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.