빅데이터로 인해 통계분석에 대한 수용이 증대되면서 구조방정식모형과 같은 진보된 2세대 분석방법의 필요성이 증가하고 있다. 본 연구는 다양한 연구 분야에서 이용되는 구조방정식모형 중 부분최소제곱모형(PLS-SEM)을 적용하는데 있어 오픈 소프트웨어인 R의 활용방법에 대해서 제안하고자 한다. R은 GNU 프로젝트의 일부로서 무료이고, 빅데이터를 포함한 통계분석에 강력하면서도 유용한 도구이다. 이에 부분최소제곱모형의 대표적인 통계패키지인 SmartPLS와 본 연구가 제안하는 R을 활용하여 측정모형의 집중타당성, 판별타당성, 내적일관성을 분석하고, 구조 모형의 경로계수 및 조절효과를 분석하여 결과를 각각 비교 분석하였다. 분석결과 R은 측정모형과 구조모형에서 모두 SmartPLS와 동일한 결과를 나타내었고, 향후 상용 통계패키지를 대체할 수 있는 강력한 도구임을 확인하였다.
빅데이터로 인해 통계분석에 대한 수용이 증대되면서 구조방정식모형과 같은 진보된 2세대 분석방법의 필요성이 증가하고 있다. 본 연구는 다양한 연구 분야에서 이용되는 구조방정식모형 중 부분최소제곱모형(PLS-SEM)을 적용하는데 있어 오픈 소프트웨어인 R의 활용방법에 대해서 제안하고자 한다. R은 GNU 프로젝트의 일부로서 무료이고, 빅데이터를 포함한 통계분석에 강력하면서도 유용한 도구이다. 이에 부분최소제곱모형의 대표적인 통계패키지인 SmartPLS와 본 연구가 제안하는 R을 활용하여 측정모형의 집중타당성, 판별타당성, 내적일관성을 분석하고, 구조 모형의 경로계수 및 조절효과를 분석하여 결과를 각각 비교 분석하였다. 분석결과 R은 측정모형과 구조모형에서 모두 SmartPLS와 동일한 결과를 나타내었고, 향후 상용 통계패키지를 대체할 수 있는 강력한 도구임을 확인하였다.
As the acceptance of statistical analysis has been increased because of Big Data, the needs for an advanced second generation of statistical analysis method like Structural Equation Model are also increasing. This study suggests how R-Program, as open software, can be utilized when Partial Least Squ...
As the acceptance of statistical analysis has been increased because of Big Data, the needs for an advanced second generation of statistical analysis method like Structural Equation Model are also increasing. This study suggests how R-Program, as open software, can be utilized when Partial Least Square Model, one of the SEMs, is applied to statistical analysis. R is a free software as a part of GNU projects as well as a powerful and useful tool for statistical analysis including Big Data. The study utilized R and SmartPLS, a representative statistical package of PLS-SEM, and analyzed internal consistency reliability, convergent validity, and discriminant validity of the measurement model. The study also analyzed path coefficients and moderator effects of the structural model and compared the results, respectively. The results indicated that R showed the same results with SmartPLS on the measurement model and the structural model. Therefore, the study confirmed that R could be a powerful tool that is alternative to a commercial statistical package in the future.
As the acceptance of statistical analysis has been increased because of Big Data, the needs for an advanced second generation of statistical analysis method like Structural Equation Model are also increasing. This study suggests how R-Program, as open software, can be utilized when Partial Least Square Model, one of the SEMs, is applied to statistical analysis. R is a free software as a part of GNU projects as well as a powerful and useful tool for statistical analysis including Big Data. The study utilized R and SmartPLS, a representative statistical package of PLS-SEM, and analyzed internal consistency reliability, convergent validity, and discriminant validity of the measurement model. The study also analyzed path coefficients and moderator effects of the structural model and compared the results, respectively. The results indicated that R showed the same results with SmartPLS on the measurement model and the structural model. Therefore, the study confirmed that R could be a powerful tool that is alternative to a commercial statistical package in the future.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구는 2세대 분석방법으로 다양한 연구 분야에서 이용되는 PLS-SEM을 적용하는데 있어 오픈 소프트웨어인 R의 분석결과에 대한 신뢰성과 타당성에 대한 의문을 정립하고자 한다. 보다 구체적으로 PLS-SEM의 대표적인 상용 통계패키지인 SmartPLS와 본 연구가 제안하는 R을 활용하여 측정모형의 내적일관성, 집중타당성, 판별타당성 및 구조모형의 경로계수와 조절효과를 분석하고 결과를 각각 비교 분석하여 R의 활용방법과 활용도를 높일 수 있는 방안을 제시하고자 한다.
따라서 본 연구는 2세대 분석방법으로 다양한 연구 분야에서 이용되는 PLS-SEM을 적용하는데 있어 오픈 소프트웨어인 R의 분석결과에 대한 신뢰성과 타당성에 대한 의문을 정립하고자 한다. 보다 구체적으로 PLS-SEM의 대표적인 상용 통계패키지인 SmartPLS와 본 연구가 제안하는 R을 활용하여 측정모형의 내적일관성, 집중타당성, 판별타당성 및 구조모형의 경로계수와 조절효과를 분석하고 결과를 각각 비교 분석하여 R의 활용방법과 활용도를 높일 수 있는 방안을 제시하고자 한다.
제안 방법
8%)으로 총 500명으로 구성되었다. 또한 측정항목은 스마트폰 브랜드 이미지에 관한 14문항, 고객만족에 관한 3문항, 충성도에 관한 5문항으로 구성되었고, 모두 7점 리커트 척도로 구성되었다.
1]과 같이 선행연구에서 사용된 연구모형과 데이터를 사용하였다[15]. 분석된 연구모형은 갤럭시와 아이폰 사용자들을 대상으로 기능적, 상징적, 경험적 브랜드 이미지가 고객만족에 미치는 영향과 고객만족이 태도적 충성도와 행동적 충성도에 미치는 영향, 그리고 이러한 인과관계의 구조 속에서 갤럭시와 아이폰 사용자 집단에 따라 어떠한 차이가 있는지 조절효과를 나타내고 있다.
오픈 소스인 R은 무료로 사용이 가능하고, 연구자가 원하는 분석을 위해 다양한 패키지를 이용하여 확장할 수 있다는 장점으로 인해 통계분석 분야에서 주목받는 언어이자 도구로 각광받고 있다. 이러한 상황 속에서 본연구는 PLS-SEM을 위한 R의 활용방법과 분석결과에 대한 신뢰성에 대한 의문을 정립하고자 상용 소프트웨어인 SmartPLS와 함께 측정모형과 구조모형을 구분하여 통계량을 각각 비교분석하였다.
일반적으로 PLS-SEM은 잠재변수들이 올바르게 측정되었는지 타당성과 신뢰성을 확인하는 측정모형 단계와 잠재변수들 간의 관계를 추정하는 구조모형 단계로 진행되기 때문에 본 연구에서는 SmartPLS와 R을 이용한 분석결과를 측정모형과 구조모형으로 구분하여 각각 비교해본다.
측정모형에서 신뢰성과 타당성이 확보되었기 때문에 다음 단계로 연구모형의 개념 간 경로계수의 유의성을 검증하는 구조모형의 추정을 실시하였다. PLS-SEM은 자료의 분포에 관한 가정을 하지 않는 비모수적 접근법의 성격을 갖기 때문에 모수의 유의성 검증을 위해 부트스트래핑을 하게 되고 여기에서 얻어진 t 통계량을 기초로 판단한다[7].
대상 데이터
본 연구에서는 PLS-SEM을 위한 상용 소프트웨어인 SmartPLS와 오픈 소프트웨어인 R을 이용하여 분석결과를 비교 분석하기 위해 [Fig. 1]과 같이 선행연구에서 사용된 연구모형과 데이터를 사용하였다[15]. 분석된 연구모형은 갤럭시와 아이폰 사용자들을 대상으로 기능적, 상징적, 경험적 브랜드 이미지가 고객만족에 미치는 영향과 고객만족이 태도적 충성도와 행동적 충성도에 미치는 영향, 그리고 이러한 인과관계의 구조 속에서 갤럭시와 아이폰 사용자 집단에 따라 어떠한 차이가 있는지 조절효과를 나타내고 있다.
최종표본의 성별은 남성 272명(54.4%), 여성 228명(45.6%)이고, 사용하는 스마트폰 브랜드는 갤럭시 271명(54.2%), 아이폰 229명(45.8%)으로 총 500명으로 구성되었다. 또한 측정항목은 스마트폰 브랜드 이미지에 관한 14문항, 고객만족에 관한 3문항, 충성도에 관한 5문항으로 구성되었고, 모두 7점 리커트 척도로 구성되었다.
이론/모형
이에 본 연구에서는 R과 함께 CRAN을 통해 배포된 PLS-SEM을 위한 패키지인 ‘plspm’을 활용하였다[14].
성능/효과
67 이상이면 강력한 설명력을 나타낸다고 볼 수 있다[10]. SmartPLS의 분석결과 고객만족에 대한 설명력은 64.9%, 태도적 충성도에 대한 설명력은 66.0%, 행동적 충성도에 대한 설명력은 63.9%로 나타났고, R의 분석결과도 이와 정확하게 일치하였다.
다음으로 판별타당성은 하나의 잠재요인이 실제로 다른 잠재요인과 구별되는 정도에 관한 것으로 각 잠재요인에 대한 AVE의 제곱근이 다른 잠재요인 간의 상관관계보다 크면 판별타당성이 있는 것이다[17]. [Table 2]와 같이 두 프로그램의 결과 모두 일치하는 것으로 나타났고, 모두 동일하게 대각선에 표시된 AVE의 제곱근이 모두 상관계수보다 더 높게 나타나 판별타당성이 존재하는 것으로 나타났다.
[Table 4]에서 보는 것처럼 잠재변수 간 경로계수의 크기와 부호는 SmartPLS와 R의 결과가 동일하게 나타났다. 경로계수의 유의성은 전적으로 부트스트래핑에 의한 표준오차에 따라 달라지기 때문에 t 값과 유의확률은 조금 다르게 나타났지만, 상징적 브랜드 이미지가 고객 만족에 미치는 경로를 제외한 모든 경로가 통계적으로 유의한 것으로 나타나 SmartPLS와 R의 분석결과 모두 차이가 없음을 확인할 수 있다.
또한 [Table 5], [Table 6]에서 보는 것과 같이 갤럭시와 아이폰 사용자 집단에 따라 경로계수의 차이가 나는지 조절효과를 검증하였는데, SmartPLS와 R의 분석결과 집단 간 경로계수의 차이, 통계적 유의성 모두 동일하게 일치하는 것으로 나타났다. 다시 말해 두 프로그램의 결과 모두 갤럭시와 아이폰 사용자 집단에 따른 조절효과는 나타나지 않는 것으로 확인되었다.
또한 [Table 5], [Table 6]에서 보는 것과 같이 갤럭시와 아이폰 사용자 집단에 따라 경로계수의 차이가 나는지 조절효과를 검증하였는데, SmartPLS와 R의 분석결과 집단 간 경로계수의 차이, 통계적 유의성 모두 동일하게 일치하는 것으로 나타났다. 다시 말해 두 프로그램의 결과 모두 갤럭시와 아이폰 사용자 집단에 따른 조절효과는 나타나지 않는 것으로 확인되었다.
마지막으로 PLS-SEM은 CB-SEM의 적합도지수(goodness of fit index) 대신 모형이 정확하게 구체화되었는지, 모형이 내생변수를 얼마나 잘 예측하는지 R2을사용하는데, 이 계수는 모형에서 예측의 정확성을 측정하며 1에 가까울수록 높은 수준의 예측 정확성을 나타낸다. R2가 0.
마지막으로 내적일관성을 나타내는 신뢰계수 알파(Cronbach’s Alpha)와 구성개념 신뢰도(Composite Reliability: CR)는 0.7 이상이면 수용 가능한데[17], SmartPLS와 R의 분석결과 [Table 3]과 같이 모든 기준을 충족시켜 내적일관성을 만족하는 것으로 나타났다.
연구결과, 측정모형의 집중타당성, 판별타당성, 내적 일치도 모두 SmartPLS와 R의 분석결과가 통계량의 차이 없이 동일하게 나타났고, 구조모형의 경로계수와 조절효과에서도 마찬가지로 분석결과가 모두 일치하는 것으로 나타났다. 통계 패키지를 이용한 분석은 연구자에게 정확한 결과를 제시하는 것이 중요한데, R은 상용 소프트웨어에 뒤지지 않는 통계분석 기능을 제공하면서 동일한 분석결과를 나타내어 타당성과 신뢰성을 확보하는 것으로 볼 수 있다.
먼저 집중타당성은 하나의 잠재요인에 대한 두 개 이상의 측정항목이 서로 통계적으로 유의한 상관관계를 갖는 정도에 관한 것이다. 요인 적재량은 0.7 이상, 평균분산추출(Average Variance Extracted: AVE)은 0.5 이상이면 집중타당성이 있다고 할 수 있는데[16], [Table 1]에서 보는 바와 같이 SmartPLS와 R 모두 큰 차이 없이 동일한 결과를 나타냈다.
7 이상이면 수용 가능한데[17], SmartPLS와 R의 분석결과 [Table 3]과 같이 모든 기준을 충족시켜 내적일관성을 만족하는 것으로 나타났다. 지금까지 분석결과를 종합해보면 SmartPLS와 R 모두 동일한 결과를 나타내었고, 모든 기준을 충족하여 타당성과 신뢰성이 확보되었다고 평가할 수 있다.
통계적 방법의 적용은 산업․기술 간의 융복합, 빅데이터의 열풍과 더불어 컴퓨터 하드웨어와 소프트웨어의 진보로 인해 접근성이 급속도로 개선되었다. 분산분석, 회귀분석, 요인분석, 군집분석 등과 같은 1세대 분석방법들은 통계분석에 대한 수용과 이에 대한 신뢰를 제공하였고, 이후 취약점을 극복하고자 구조방정식모형으로 지칭되는 2세대 분석방법이 급속하게 확장되었다[1].
후속연구
불법 복제품을 사용하여 얻은 연구 결과를 발표하는 것은 윤리적으로도 문제가 될 수 있는데, 기관, 학교, 학생 모두 저작권 문제에서 비용이 발생하지 않기 때문에 연구개발에 자유도를 높일 수 있고 비용절감의 측면에서 도움이 될 것이다. 본 연구결과는 PLS-SEM을 활용하는 연구자들에게 도움이 될 수 있을 것으로 판단되며, 향후 통계분석에 있어 R의 활용도가 높아질 수 있기를 기대해본다.
질의응답
핵심어
질문
논문에서 추출한 답변
빅데이터의 발전에 따라 필요해지는 것은 무엇인가?
빅데이터로 인해 통계분석에 대한 수용이 증대되면서 구조방정식모형과 같은 진보된 2세대 분석방법의 필요성이 증가하고 있다. 본 연구는 다양한 연구 분야에서 이용되는 구조방정식모형 중 부분최소제곱모형(PLS-SEM)을 적용하는데 있어 오픈 소프트웨어인 R의 활용방법에 대해서 제안하고자 한다.
R의 장점 중 패키지 형태의 기능들이 존재하는 방식은 무엇인가?
또한 R의 장점 중의 하나는 패키지(package) 형태로 기능을 공유하여 확장이 용이하다는 점이다. R에서 사용할 수 있는 유용한 함수들은 자동적으로 설치되지 않고, 이러한 함수들은 특정 작업을 수행하기 위해 작성된 코드 라이브러리인 패키지를 추가로 설치해야 한다[13]. 다시 말해 패키지는 사용자가 꼭 필요한 것만 설치해서 사용할 수 있도록 미리 작성되어 있는 함수와 객체들을 모아 놓은 것을 의미하는데, CRAN(Comprehensive R Archive Network)에서 다운로드 받으면 이런 툴들을 누구나 무료로 사용할 수 있고, 2015년 10월 기준으로 CRAN에는 약 7,345개 패키지가 업로드 되어 있다. 이에 본 연구에서는 R과 함께 CRAN을 통해 배포된 PLS-SEM을 위한 패키지인 ‘plspm’을 활용하였다[14].
통계적 방법의 적용의 접근성이 개선된 배경은 무엇인가?
통계적 방법의 적용은 산업․기술 간의 융복합, 빅데이터의 열풍과 더불어 컴퓨터 하드웨어와 소프트웨어의 진보로 인해 접근성이 급속도로 개선되었다. 분산분석, 회귀분석, 요인분석, 군집분석 등과 같은 1세대 분석방법들은 통계분석에 대한 수용과 이에 대한 신뢰를 제공하였고, 이후 취약점을 극복하고자 구조방정식모형으로 지칭되는 2세대 분석방법이 급속하게 확장되었다[1].
참고문헌 (17)
J. F. Hair Jr, G. T. M. Hult, C. Ringle, and M. Sarstedt, "A Primer on Partial Least Squares Structural Equation Modeling(PLS-SEM)", Sage Publications, 2013.
W. W. Chin, "The Partial Least Squares Approach to Structural Equation Modeling", Modern Methods for Business Research, Vol. 295, No. 2, pp. 295-336, 1998.
J. F. Hair, C. M. Ringle, and M. Sarstedt, "PLS-SEM: Indeed a Silver Bullet", Journal of Marketing Theory and Practice, Vol. 19, No. 2, pp. 139-152, 2011.
J. Verzani, "Using R for Introductory Statistics", Chapman & Hall/CRC, 2004.
W. W. Chin, "Issues and Opinion on Structural Equation Modeling", MIS Quarterly, Vol. 22, No. 1, pp. 7-16, 1998.
B. R. Bae, "Analyses of Moderating and Mediating Effects with SPSS/AMOS/LISREL/ Smartpls", Ckbooks, 2015.
C. Cassel, P. Hackl, and A. H. Westlund, "Robustness of Partial Least-Squares Method for Estimating Latent Variable Quality Structures", Journal of Applied Statistics, Vol. 26, No. 4, pp. 435-446, 1999.
H. Kim, K. H. Park, "The Impact of Collaboration Process and Capabilities on Innovation Performance in Convergence Environment", Journal of Digital Convergence, Vol. 13, No. 5, pp. 151-158, 2015.
J. Henseler, C. M. Ringle, and R. R. Sinkovics, "The Use of Partial Least Squares Path Modeling in International Marketing", Advances in International Marketing(AIM), Vol. 20, pp. 277-320, 2009.
Y. B. Yang, M. C. Kim, "Effect of HPM Factors on Adoption Attitude of u-Health System: Moderating Effects of Gender", Journal of Digital Convergence, Vol. 13, No. 7, pp. 213-221, 2015.
L. A. Pace, "Beginning R: An Introduction to Statistical Programming", Apress, 2012.
G. Grolemund, "Hands-on Programming with R: Write Your Own Functions and Simulations", O'Reilly Media, 2014.
G. Sanchez, "PLS Path Modeling with R", Online, 2013.
S. Y. Kim, S. J. Lee, "Effects of Smart Phone's Brand Images on Customer's Satisfaction and Loyalty: Focused on Galaxy and iPhone User Groups", Journal of Digital Convergence, Vol. 12, No. 10, pp. 223-233, 2014.
E. G. Carminesa and R. A. Zeller, "Reliability and Validity Assessment", Sage Publications, 1979.
C. Fornell and D. F. Larcker, "Evaluating Structural Equation Models with Unobservable Variables and Measurement Error", Journal of Marketing Research, Vol. 18, No. 1, pp. 39-50, 1981.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.