개방형협업 참여자 기여도와 네트워크 특성과의 관계에 대한 연구 : 깃허브 오픈소스 프로젝트를 중심으로 Identifying the Network Characteristics of Contributors That Affect Performance in Open Collaboration : Focusing on the GitHub Open Source원문보기
발전된 정보통신기술은 개방형협업을 위한 오픈 플랫폼 역할을 수행함으로써 개인간 상호협력을 용이하게 한다. 본 연구에서는 사회연결망이론을 바탕으로 개방형협업의 대표적 형태로 주목받고 있는 오픈소스 프로젝트의 상호협력 네트워크를 살펴보고자 한다. 특히 상호협력 네트워크 내에서의 개방형협업 기여도가 높은 참여자의 네트워크 중심구조를 분석해보고자 한다. 이를 위해 대표적인 오픈소스 프로젝트 플랫폼인 깃허브(GitHub)의 782개 리파지토리의 8,101명의 개발자를 대상으로 782개의 협업 네트워크를 도출함으로써, 협업에 있어 기여도가 높은 개발자의 연결 근접 매개 중심성 특성을 분석하였다. 분석 결과, 연결 매개 근접 중심성이 높은 개발자의 커밋수가 많아지는 것으로 나타났으며, 이중에서도 매개중심성에 의해 그 관계를 가장 잘 설명할 수 있는 것으로 나타났다. 또한 네트워크 사이즈가 클수록, 허브가 존재할수록 개발자의 매개중심성과 커밋수 간의 관련성이 더욱 커지는 것으로 나타났다. 본 연구는 향후 개방형협업의 성공적인 운영을 위한 시사점을 제시해줄 것으로 기대된다.
발전된 정보통신기술은 개방형협업을 위한 오픈 플랫폼 역할을 수행함으로써 개인간 상호협력을 용이하게 한다. 본 연구에서는 사회연결망이론을 바탕으로 개방형협업의 대표적 형태로 주목받고 있는 오픈소스 프로젝트의 상호협력 네트워크를 살펴보고자 한다. 특히 상호협력 네트워크 내에서의 개방형협업 기여도가 높은 참여자의 네트워크 중심구조를 분석해보고자 한다. 이를 위해 대표적인 오픈소스 프로젝트 플랫폼인 깃허브(GitHub)의 782개 리파지토리의 8,101명의 개발자를 대상으로 782개의 협업 네트워크를 도출함으로써, 협업에 있어 기여도가 높은 개발자의 연결 근접 매개 중심성 특성을 분석하였다. 분석 결과, 연결 매개 근접 중심성이 높은 개발자의 커밋수가 많아지는 것으로 나타났으며, 이중에서도 매개중심성에 의해 그 관계를 가장 잘 설명할 수 있는 것으로 나타났다. 또한 네트워크 사이즈가 클수록, 허브가 존재할수록 개발자의 매개중심성과 커밋수 간의 관련성이 더욱 커지는 것으로 나타났다. 본 연구는 향후 개방형협업의 성공적인 운영을 위한 시사점을 제시해줄 것으로 기대된다.
Information and communications technology facilitates collaboration among individuals by functioning as an open platform for open collaboration projects. In this regard, this study aims to understand the network characteristics of participants who contribute greatly to open collaboration by investig...
Information and communications technology facilitates collaboration among individuals by functioning as an open platform for open collaboration projects. In this regard, this study aims to understand the network characteristics of participants who contribute greatly to open collaboration by investigating the mutual cooperation network in an open source project, which represents a form of open collaboration based on social network theory. To achieve this objective, this study analyzes the network centrality of developers with a high number of commits, particularly 8,101 developers in 782 repositories in GitHub, a representative open source platform. This study also determines how the relationship between network centrality and number of commits depends on the size of a repository network and the presence of a hub. Consequently, the number of commits by developers with high degree, betweenness, and closeness centrality is increasing. Among which, betweenness centrality has the highest explanatory power. Furthermore, when a hub is present and as network size increases, the relationship between the betweenness centrality of a developer and his/her number of commits continues to grow. This study is expected to provide suggestions for the successful performance of open collaboration projects in the future.
Information and communications technology facilitates collaboration among individuals by functioning as an open platform for open collaboration projects. In this regard, this study aims to understand the network characteristics of participants who contribute greatly to open collaboration by investigating the mutual cooperation network in an open source project, which represents a form of open collaboration based on social network theory. To achieve this objective, this study analyzes the network centrality of developers with a high number of commits, particularly 8,101 developers in 782 repositories in GitHub, a representative open source platform. This study also determines how the relationship between network centrality and number of commits depends on the size of a repository network and the presence of a hub. Consequently, the number of commits by developers with high degree, betweenness, and closeness centrality is increasing. Among which, betweenness centrality has the highest explanatory power. Furthermore, when a hub is present and as network size increases, the relationship between the betweenness centrality of a developer and his/her number of commits continues to grow. This study is expected to provide suggestions for the successful performance of open collaboration projects in the future.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
개방형협업의 성공을 연구하기 위해 본 연구에서는 오픈소스 프로젝트의 대표적 플랫폼인 깃허브의 상호협력 네트워크 구조를 사회연결망이론을 통해 살펴보았다. 특히 본 연구에서는 공동연구 네트워크 내에서의 개발자의 역할과 개발자의 자발적 프로젝트에서의 기여도와의 관련성을 살펴보고자 하였다.
특히, 기존 연구는 프로젝트를 분석 대상으로 하여 오픈소스 프로젝트의 성과와 네트워크 구조와의 관련성을 보고자 하는 연구가 주로 이루어졌으며, 개별적인 개발자의 성과에 초점을 맞춘 연구는 거의 이루어지지 않았다. 따라서 깃허브 오픈소스 프로젝트의 개발자간 상호협력 네트워크 구조를 통해 활동적인 개발자의 네트워크 특성을 살펴봄으로써 이를 보완하고자 한다.
이처럼 집단지성을 통한 개방형협업의 활용 및 중요성이 증가하고 있음에도 불구하고, 개방형협업이 이루어지는 프로세스 및 네트워크 구조에 대한 연구는 비교적 제한된 편이다. 따라서 본 연구에서는 개방형 협업의 대표적인 형태인 오픈소스 프로젝트다수의 개발자가 소프트웨어를 공동으로 개발함으로써 보다 나은 소프트웨어를 단기간에 개발할 수 있음을 목적으로 함-를 통해 성공적인 개방형협업을 위한 개발자간 네트워크 구조를 분석해보고자 한다. 특히, 본 논문에서는 오픈소스 프로젝트 개발자간의 협업에 있어 어떠한 네트워크 특성을 가진 참여자의 기여도가 높을지를 중점적으로 살펴보고자 한다.
연결·매개·근접 세 가지 중심성의 경우 상호간의 상관계수가 높으므로([Table 3] 참조), 하나의 모델에서 이를 고려할 경우 다중공선성 문제가 발생할 수 있다. 따라서 본 연구에서는 세 가지 중심성 중 가장 영향력이 높은 매개중심성을 독립변수로 한 모형을 최종적으로 만들고자 한다. 최종 모델에서는 리파지토리 내에서의 개발자커밋수(Commitij)에 미치는 통제변수로서 개발자활동기간(Periodi), 개발자활동 리파지토리수(RepoNumberi), 리파지토리커밋수(TotalCommitj), 리파지토리사이즈(Sizej) 를 고려하였고, 독립변수로는 개발자의 리파지토리 공동연구망 내 매개중심성(BetCentralityij)과 매개중심성의 이차항(BetCentralityij2)을 고려하였다.
본 장에서는 깃허브 데이터를 기반으로 탐색적 분석을 통해 개발자의 리파지토리 협업 네트워크에서의 중심성과 개발자의 리파지토리 내에서의 기여도와의 관련성을 살펴보고자 한다. 또한 리파지토리의 특성인 네트워크 사이즈와 허브 존재여부가 앞서 도출한 관련성에 어떤 영향을 미치는지를 살펴보고자 한다. 추가적으로 리파지토리의 운영자와 비운영자 간 네트워크 중심성에 대한 차이를 분석하고자 한다.
96개로 1개가 미쳐 되지 않았다. 본 분석에서는 허브를 가지는 리파지토리와 그렇지 않은 리파지토리를 나누어 조절효과를 살펴보았다. 분석 결과, 허브수가 많은 리파지토리의 경우 매개중심성과 커밋수와의 관련성이 더욱 강해짐을 확인할 수 있다.
본 연구는 개방형협업을 위한 참여자간 공동 연구 연결망의 네트워크 특성과 개발자의 성과에 관해 살펴봄을 목적으로 한다. 최근 개방형협업이 활발히 이루어지고 있고, 그 중요성 또한 주목 받고 있지만 개방형협업에서 주요한 역할을 하는 자발적 참여자들의 네트워크 특성에 대해 살펴본 연구는 많지 않다.
[Table 1]은 본 연구를 위해 깃허브에서 수집된 변수에 대해 설명하고 있다. 본 연구에서 사용된 종속변수인 기여도는 기존연구에 따르면, 공통적인 목적을 달성하기 위해 각각의 구성원들이 업무와 관련된 행동을 하는 것을 의미하며[33], 본 연구에서는 각 개발자의 특정 리파지토리에서의 커밋수로 이를 측정하고자 하였다. 즉, 본 연구에서는 개발자 i가 리파지토리 j에서 이룬 기술적 성과인 커밋수(Commitij)를 개발자 i의 리파지토리 j에 대한 기여도라 정의하였다.
즉, 오픈소스 프로젝트는 누구든 접근이 가능하며 어떤 사람이든 기여할 수 있고(평등주의), 공헌자들은 그들의 실력을 바탕으로 투명하게 평가받을 수 있으며(실력주의), 프로젝트 커뮤니티는 어떻게 조직을 형성하고 프로젝트를 진행할지를 자발적으로 결정하게 된다는(자발조직) 특징을 가진다. 본 연구에서는 사회연결망이론을 바탕으로 성공적인 자발조직의 형태에 초점을 맞추어 공동연구 네트워크 형태와 참여자들의 자발적 참여에 대해 살펴보고자 한다. 이를 위해 오픈소스 프로젝트를 진행할 수 있는 대표적인 인터넷 기반 플랫폼 깃허브(GitHub)의 실제 데이터를 수집하여 실증분석을 실시하고자 한다.
본 장에서는 깃허브 데이터를 기반으로 탐색적 분석을 통해 개발자의 리파지토리 협업 네트워크에서의 중심성과 개발자의 리파지토리 내에서의 기여도와의 관련성을 살펴보고자 한다. 또한 리파지토리의 특성인 네트워크 사이즈와 허브 존재여부가 앞서 도출한 관련성에 어떤 영향을 미치는지를 살펴보고자 한다.
협업에서의 사회연결망분석은 참여자 개별적 속성뿐만 아니라 참여자 상호간 관계적 속성을 대상으로 분석이 이루어지므로 상호작용에 의한 협업의 기본적인 성격을 반영할 수 있는 적절한 방법이라 판단된다. 일반 적으로 사회연결망 분석은 네트워크 특성 분석, 중심구조 분석, 응집구조 분석, 역할구조 분석의 4가지 방법을 통한 접근이 가능하며, 본 연구에서는 이러한 분석 방법 중, 개별적인 노드 단위의 중심구조 분석을 실시하여 네트워크 구조 내에서 중요한 역할을 수행하는 노드를 파악하고자 한다. 네트워크 중심성으로는 크게 연결중심성(Degree Centrality), 매개 중심성(Betweenness Centrality), 근접중심성 (Closeness Centrality)의 세 가지를 들 수 있으며[30], 각각의 중심성이 의미하는 바는 다음과 같다.
또한 리파지토리의 특성인 네트워크 사이즈와 허브 존재여부가 앞서 도출한 관련성에 어떤 영향을 미치는지를 살펴보고자 한다. 추가적으로 리파지토리의 운영자와 비운영자 간 네트워크 중심성에 대한 차이를 분석하고자 한다.
탐색적 분석을 통해 개발자의 세 가지 네트워크 중심성(연결중심성, 매개중심성, 근접중심성)을 대상으로 개발자의 기여도와의 관련성을 살펴본 후, 네트워크의 사이즈와 허브의 존재여부 등 리파지토리 특성의 조절효과를 살펴보고자 한다. 추가적으로 리파지토리의 운영자와 비운영자 간 네트워크 특성의 차이를 분석하고자 한다.
이를 위해 깃허브의 782개 리파지토리에 속하는 8,101명의 개발자를 대상으로, 커밋수가 높은 개발자의 네트워크 중심성 특성을 분석하고자 한다. 탐색적 분석을 통해 개발자의 세 가지 네트워크 중심성(연결중심성, 매개중심성, 근접중심성)을 대상으로 개발자의 기여도와의 관련성을 살펴본 후, 네트워크의 사이즈와 허브의 존재여부 등 리파지토리 특성의 조절효과를 살펴보고자 한다. 추가적으로 리파지토리의 운영자와 비운영자 간 네트워크 특성의 차이를 분석하고자 한다.
개방형협업의 성공을 연구하기 위해 본 연구에서는 오픈소스 프로젝트의 대표적 플랫폼인 깃허브의 상호협력 네트워크 구조를 사회연결망이론을 통해 살펴보았다. 특히 본 연구에서는 공동연구 네트워크 내에서의 개발자의 역할과 개발자의 자발적 프로젝트에서의 기여도와의 관련성을 살펴보고자 하였다. 이를 위해 대표적인 오픈소스 프로젝트 플랫폼인 깃허브에서 활발한 활동이 이루어지고 있는 782개의 리파지토리를 대상으로 개발자간 협업 네트워크를 분석하였다.
따라서 본 연구에서는 개방형 협업의 대표적인 형태인 오픈소스 프로젝트다수의 개발자가 소프트웨어를 공동으로 개발함으로써 보다 나은 소프트웨어를 단기간에 개발할 수 있음을 목적으로 함-를 통해 성공적인 개방형협업을 위한 개발자간 네트워크 구조를 분석해보고자 한다. 특히, 본 논문에서는 오픈소스 프로젝트 개발자간의 협업에 있어 어떠한 네트워크 특성을 가진 참여자의 기여도가 높을지를 중점적으로 살펴보고자 한다.
가설 설정
이를 위해 파이썬(Python) 을 활용한 웹크롤러(web crawler)를 구축하여 깃허브 API 및 깃허브 웹페이지를 활용하여 정보를 수집하였다. 리파지토리에 소속된 각 이슈에 대해 토의를 한 개발자들을 대상으로 상호협력이 이루어졌다고 가정하고[8], 사회연결망분석을 위한 개발자-이슈간 2-모드 네트워크 데이터 형태를 구축하였다. 사회연결망 분석에서 2-모드 네트워크란 서로 성질이 다른 개체 간의 관계로 구성된 네트워크를 의미하며, 본 연구에서는 이슈-개발자의 상이한 개체간 네트워크로 구성된다.
협업 네트워크 내에서 연결중심성이 평균값보다 3표준편차 이상인 노드(개발자)를 허브로 가정하였다. 즉 협업 네트워크 내에서의 허브 개발자는 일반적인 개발자들과는 달리, 다른 개발자와의 협업이 빈번히 이루어진다.
제안 방법
각 리파지토리 공동연구 네트워크 내에서의 연결·매개·근접 세 가지 중심성과 개발자의 커밋수와의 관련성을 살펴보기 위해 각 모델에서의 표준화 계수값을 산정하여 비교해 보았다([Table 4] 참조).
즉 최종적으로 분석대상으로 선정된 782개 리파지토리 각각의 개발자간 협업 네트워크를 구성함으로써 (리파지토리별로 782회의 사회연결망 분석을 실시함으로써) 도출된 값들이다. 개발자가 갖는 특성 및 리파지토리가 가지는 특성을 통제하기 위해 통제변수로는 개발자의 활동기간 (Periodi), 개발자의 활동 리파지토리수(Repo Numberi) 및 리파지토리의 전체 커밋수(Total Commitj), 리파지토리의 사이즈(Sizej)를 고려하였다. [Figure 1]은 깃허브에서 리파지토리 내에서 하나의 이슈에 대해서 개발자간 코멘트를 공유한 화면을 보여준다.
둘째, 앞서 리파지토리의 속성에 따라 개발자의 매개중심성과 개발자의 커밋수와의 관계가 어떻게 달라지는지 알아보기 위해 리파지토리의 네트워크 사이즈 및 허브 존재유무의 조절효과를 분석해보았다. 분석 결과, 네트워크 사이즈가 클수록, 네트워크 내에 허브가 존재할수록 매개중심성과 개발자 커밋 수의 관련성이 커지는 것으로 나타났다.
[Table 6]은 위계적 회귀분석 결과를 정리한 표이다. 모델 1에서는 리파지토리 커밋수를 제외한 세 가지 통제변수의 영향력을 살펴보았으며, 모델 2에서는 통제변수 중 개발자 커밋수에 가장 많은 영향을 미치는 리파지토리 커밋수를 추가로 고려하였다. 모델 3에서는 독립변수인 매개중심성을 추가로 투입하였으며, 모델 4에서는 최종적으로 매개중심성의 2차항까지 고려하였다.
모델 1에서는 리파지토리 커밋수를 제외한 세 가지 통제변수의 영향력을 살펴보았으며, 모델 2에서는 통제변수 중 개발자 커밋수에 가장 많은 영향을 미치는 리파지토리 커밋수를 추가로 고려하였다. 모델 3에서는 독립변수인 매개중심성을 추가로 투입하였으며, 모델 4에서는 최종적으로 매개중심성의 2차항까지 고려하였다. 모델 분석 결과, 개발자 활동기간이 길수록, 개발자가 활동하고 있는 리파지토리 개수가 작을수록, 리파지토리의 사이즈 및 전체 커밋수가 많을수록 각 개발자의 리파지토리 내에서의 커밋수가 증가하는 것으로 나타났다.
본 연구의 독립변수는 협업을 위한 목적으로 참여자간 관계망이 형성됨으로써 도출된 네트워크 특성으로, 개발자 수준의 네트워크 특성을 측정하기 위해 각 개발자의 리파지토리 내에서의 세 가지 중심성 지수를 사용하였다. 앞서 정의한 연결중심성(DegCentralityij), 매개중심성 (BetCentralityij), 근접중심성(CloCentralityij) 지수를 사용하였다.
앞서 정의한 연결중심성(DegCentralityij), 매개중심성 (BetCentralityij), 근접중심성(CloCentralityij) 지수를 사용하였다. 본 연구의 독립변수로서 사용된 세 가지 중심성 지수는 리파지토리별 개발자-이슈간 2-모드 네트워크를 개발자간 1-모드 네트워크로 변환하여 네트워크를 구성한 후, 협업 네트워크 내에서의 개발자들의 네트워크 중심성을 도출하였다. 즉 최종적으로 분석대상으로 선정된 782개 리파지토리 각각의 개발자간 협업 네트워크를 구성함으로써 (리파지토리별로 782회의 사회연결망 분석을 실시함으로써) 도출된 값들이다.
비록 본 연구를 위해 수집된 데이터는 시계열 데이터가 아니기 때문에 오픈소스 프로젝트의 진화에 대한 분석을 하기는 어려우나, 수집된 리파지토리의 네트워크 사이즈의 상이함으로 인해 본 데이터를 통해 네트워크의 성장에 따른 특성을 살펴볼 수 있다. 본 분석(1차항 분석)을 통해 네트워크가 진화할수록(네트워크의 크기가 커질수록[3]) 매개중심성이 큰 개발자의 역할이 더욱 커짐을 확인할 수 있다.
앞서 기여율이 높은 개발자들의 네트워크 중심구조에 대해 초점을 맞추었다면, 본 분석에서는 리파지토리 운영자(owner)의 네트워크 중심구조를 비운영자와의 네트워크 중심구조와 비교․분석하였다. 아래 [Table 11] 및 [Figure 4]에서 제시하는 바와 같이, 운영자의 연결·매개·근접 중심성 모두 비운영자에 비해 통계적으로 유의한 수준에서 높은 수치를 가지는 것으로 나타났다.
본 연구에서는 사회연결망이론을 바탕으로 성공적인 자발조직의 형태에 초점을 맞추어 공동연구 네트워크 형태와 참여자들의 자발적 참여에 대해 살펴보고자 한다. 이를 위해 오픈소스 프로젝트를 진행할 수 있는 대표적인 인터넷 기반 플랫폼 깃허브(GitHub)의 실제 데이터를 수집하여 실증분석을 실시하고자 한다. 2008년 만들어진 깃허브는 2014년 340만 명 이상의 소프트웨어 개발자들에 의해 활용되고 있으며, 1,000만개 이상의 리파지토리(repository : 프로젝트의 소스코드 저장소)가 운영되고 있다[40].
추가적으로 공동연구 네트워크를 형성하기 위해, 타겟 리파지토리의 각 이슈 (issue)를 대상으로 하나의 이슈에 함께 토의에 참여한(코멘트를 남긴) 개발자들에 대한 정보를 수집하였다. 이를 위해 파이썬(Python) 을 활용한 웹크롤러(web crawler)를 구축하여 깃허브 API 및 깃허브 웹페이지를 활용하여 정보를 수집하였다. 리파지토리에 소속된 각 이슈에 대해 토의를 한 개발자들을 대상으로 상호협력이 이루어졌다고 가정하고[8], 사회연결망분석을 위한 개발자-이슈간 2-모드 네트워크 데이터 형태를 구축하였다.
따라서 본 연구에서는 세 가지 중심성 중 가장 영향력이 높은 매개중심성을 독립변수로 한 모형을 최종적으로 만들고자 한다. 최종 모델에서는 리파지토리 내에서의 개발자커밋수(Commitij)에 미치는 통제변수로서 개발자활동기간(Periodi), 개발자활동 리파지토리수(RepoNumberi), 리파지토리커밋수(TotalCommitj), 리파지토리사이즈(Sizej) 를 고려하였고, 독립변수로는 개발자의 리파지토리 공동연구망 내 매개중심성(BetCentralityij)과 매개중심성의 이차항(BetCentralityij2)을 고려하였다. 분석을 위해서는 위계적 회귀분석 모형을 사용하였다.
이러한 기준에 적합한 11,503개의 리파지토리를 대상으로 리파지토리 및 개발자 관련 정보를 수집하였다. 추가적으로 공동연구 네트워크를 형성하기 위해, 타겟 리파지토리의 각 이슈 (issue)를 대상으로 하나의 이슈에 함께 토의에 참여한(코멘트를 남긴) 개발자들에 대한 정보를 수집하였다. 이를 위해 파이썬(Python) 을 활용한 웹크롤러(web crawler)를 구축하여 깃허브 API 및 깃허브 웹페이지를 활용하여 정보를 수집하였다.
협업 네트워크 사이즈 및 허브 존재여부에 따라 개발자의 매개중심성과 커밋수와의 관계가 어떻게 달라지는지를 살펴보기 위해, 리파지토리 네트워크 사이즈와 네트워크 내 허브 존재유무에 의한 그룹을 중심으로 조절효과를 분석하였다.
대상 데이터
수집된 11,503개의 리파지토리가 모두 활성화되지는 않았으며, 실질적으로 공동연구가 아닌 개인연구 수준에서 리파지토리가 운영되는 경우도 많이 존재 한다[18]. 따라서 본 연구에서는 앞서 선택한 11,503개의 리파지토리 중 사회연결망 분석이 가능한 수준인 하나의 리파지토리 내에서 이슈 코멘트가 100개 이상인 782개의 리파지토리를 최종 분석 대상으로 하였다[8].
본 연구의 분석대상이 된 깃허브 리파지토리는 데이터를 수집한 2014년 3월 17일을 기준으로 만들어진 지 1년 가량 된 리파지토리 (2013년 1월 1일부터 2013년 2월 28일 기간 동안 생성된 리파지토리) 중, 스테어링(Starring: 개발자가 관심이 있는 특정 리파지토리를 스테어링하면 그 리파지토리가 북마크됨)의 수가 5개 이상(특정 리파지토리를 즐겨찾기 한 개발자가 5인 이상)인 리파지토리이다. 이러한 기준에 적합한 11,503개의 리파지토리를 대상으로 리파지토리 및 개발자 관련 정보를 수집하였다.
3.2 기초 자료 분석
분석대상인 리파지토리 782개에 소속된 개발자들 중 종속변수로 쓰인 커밋수(Commitij) 가 평균에서 3표준편차 이상 떨어지지 않은 개발자만을 대상으로 분석을 실시하였다. 이 중 관련 변수에 대한 데이터를 모두 확보할 수 있는 8,101개의 데이터(782개의 리파지토리에 소속된 8,101명의 개발자에 대한 데이터) 를 대상으로 분석을 시도한 결과([Table 2]참조), 개발자의 특정 리파지토리에서의 평균 커밋수(Commitij)는 56개, 평균 연결중심성 (DegCentralityij)은 0.
본 연구의 분석대상이 된 깃허브 리파지토리는 데이터를 수집한 2014년 3월 17일을 기준으로 만들어진 지 1년 가량 된 리파지토리 (2013년 1월 1일부터 2013년 2월 28일 기간 동안 생성된 리파지토리) 중, 스테어링(Starring: 개발자가 관심이 있는 특정 리파지토리를 스테어링하면 그 리파지토리가 북마크됨)의 수가 5개 이상(특정 리파지토리를 즐겨찾기 한 개발자가 5인 이상)인 리파지토리이다. 이러한 기준에 적합한 11,503개의 리파지토리를 대상으로 리파지토리 및 개발자 관련 정보를 수집하였다. 추가적으로 공동연구 네트워크를 형성하기 위해, 타겟 리파지토리의 각 이슈 (issue)를 대상으로 하나의 이슈에 함께 토의에 참여한(코멘트를 남긴) 개발자들에 대한 정보를 수집하였다.
이를 위해 깃허브의 782개 리파지토리에 속하는 8,101명의 개발자를 대상으로, 커밋수가 높은 개발자의 네트워크 중심성 특성을 분석하고자 한다. 탐색적 분석을 통해 개발자의 세 가지 네트워크 중심성(연결중심성, 매개중심성, 근접중심성)을 대상으로 개발자의 기여도와의 관련성을 살펴본 후, 네트워크의 사이즈와 허브의 존재여부 등 리파지토리 특성의 조절효과를 살펴보고자 한다.
특히 본 연구에서는 공동연구 네트워크 내에서의 개발자의 역할과 개발자의 자발적 프로젝트에서의 기여도와의 관련성을 살펴보고자 하였다. 이를 위해 대표적인 오픈소스 프로젝트 플랫폼인 깃허브에서 활발한 활동이 이루어지고 있는 782개의 리파지토리를 대상으로 개발자간 협업 네트워크를 분석하였다. 분석을 통해 크게 다음의 세 가지 분석 결과를 얻을 수 있었다.
본 연구의 독립변수로서 사용된 세 가지 중심성 지수는 리파지토리별 개발자-이슈간 2-모드 네트워크를 개발자간 1-모드 네트워크로 변환하여 네트워크를 구성한 후, 협업 네트워크 내에서의 개발자들의 네트워크 중심성을 도출하였다. 즉 최종적으로 분석대상으로 선정된 782개 리파지토리 각각의 개발자간 협업 네트워크를 구성함으로써 (리파지토리별로 782회의 사회연결망 분석을 실시함으로써) 도출된 값들이다. 개발자가 갖는 특성 및 리파지토리가 가지는 특성을 통제하기 위해 통제변수로는 개발자의 활동기간 (Periodi), 개발자의 활동 리파지토리수(Repo Numberi) 및 리파지토리의 전체 커밋수(Total Commitj), 리파지토리의 사이즈(Sizej)를 고려하였다.
이론/모형
최종 모델에서는 리파지토리 내에서의 개발자커밋수(Commitij)에 미치는 통제변수로서 개발자활동기간(Periodi), 개발자활동 리파지토리수(RepoNumberi), 리파지토리커밋수(TotalCommitj), 리파지토리사이즈(Sizej) 를 고려하였고, 독립변수로는 개발자의 리파지토리 공동연구망 내 매개중심성(BetCentralityij)과 매개중심성의 이차항(BetCentralityij2)을 고려하였다. 분석을 위해서는 위계적 회귀분석 모형을 사용하였다. 위계적 회귀분석모형은 연구자의 연구목적에 맞게 독립변수를 추가적으로 투입해가며 그 영향력을 검증하는 모델이다.
따라서 이러한 복잡계이론은 개체 자체의 특성뿐만 아니라 네트워크 구조 내에서 상호작용하고 있는 개체의 특성을 살펴보는 것이 중요함을 시사한다. 이러한 복잡계로서의 연결망 사회를 살펴보기 위해, 본 연구에서는 관계적 인간관에 입각하여 인간 행위 및 사회 구조를 설명하고자 하는 사회연결망이론(SNT : Social Network Theory) 을 이론적 배경으로 한다. 이 이론에 따르면, 각 개인의 상호작용 연결망은 행위를 통해 생산·유지되는 동시에 개인들에 의해 생겨나는 연결망 구조는 그들의 행위에 영향을 미친다[17].
성능/효과
428로 나타났으며, 이 평균값을 기준으로 네트워크 사이즈가 큰 리파지 토리와 작은 리파지토리로 나누어 분석을 실시하였다. 1차항 모형(위계적 회귀분석 모델 3)을 분석한 결과, 네트워크 사이즈가 큰 경우 매개중심성과 커밋수와의 관련성이 더욱 강해짐을 확인할 수 있다([Table 7] 참조). [Table 7]은 1차항 모형을 대상으로 두 가지 그룹에서의 매개중심성과 개발자 커밋수 관계에 있어서의 차이점을 분석하였으며, [Table 8]에서는 2차항 모형(위계적 회귀분석 모델 4)을 대상으로 동일한 분석을 실시하였다.
이를 통해 세 가지 중심성 모두 개발자의 커밋수에 미치는 영향이 선형이 아닌 비선형임을 확인할 수 있다. 또한 세 가지 중심성 중, 매개중심성이 1차항, 2차항 모형 모두에서 가장 설명력이 큰 것으로 나타났다. 이는 논문의 공동저자 네트워크에서 매개중심성이 높은 학자일수록 새로운 학자들과의 공동연구가 더욱 빈번하게 이루어진다는 Abbasi et al.
첫째, 연결·매개·근접 중심성 세 가지 모두 개발자의 커밋수와 긍정적인 관계를 가지는 것으로 나타났다. 또한 이러한 세 가지 관련성 모두 1차항이 아닌 2차항으로 설명할 경우 설명력이 더욱 증가하는 것으로 나타났다. 특히, 다수의 공동개발자를 연결해 주는 역할을 수행하는 개발자의 매개중심성이 높을수록 그 개발자의 커밋수 또한 증가하는 경향이 강한 것으로 나타났다.
모델 3에서는 독립변수인 매개중심성을 추가로 투입하였으며, 모델 4에서는 최종적으로 매개중심성의 2차항까지 고려하였다. 모델 분석 결과, 개발자 활동기간이 길수록, 개발자가 활동하고 있는 리파지토리 개수가 작을수록, 리파지토리의 사이즈 및 전체 커밋수가 많을수록 각 개발자의 리파지토리 내에서의 커밋수가 증가하는 것으로 나타났다. 또한 매개중심성은 역U자(inverted-U)형태로 커밋수와 관련성이 있음을 확인할 수 있다 ([Table 5], [Table 6] 참조).
비록 본 연구를 위해 수집된 데이터는 시계열 데이터가 아니기 때문에 오픈소스 프로젝트의 진화에 대한 분석을 하기는 어려우나, 수집된 리파지토리의 네트워크 사이즈의 상이함으로 인해 본 데이터를 통해 네트워크의 성장에 따른 특성을 살펴볼 수 있다. 본 분석(1차항 분석)을 통해 네트워크가 진화할수록(네트워크의 크기가 커질수록[3]) 매개중심성이 큰 개발자의 역할이 더욱 커짐을 확인할 수 있다.
본 연구는 오픈소스 프로젝트뿐만 아니라 더 나아가 개방형협업의 형태로 이루어질 다양한 프로젝트의 성공을 위한 효율적인 운영에 있어 가이드라인을 제공해줄 수 있을 것으로 기대된다. 본 연구를 통해 개방형협업의 성공을 위해서는 매개중심성이 높은 개발자를 중점적으로 관리할 필요성이 커짐을 확인하였다. 특히, 협업 네트워크가 진화할수록 매개 중심성을 가지는 개발자의 중요성은 더욱 커지는 것으로 나타났다.
둘째, 앞서 리파지토리의 속성에 따라 개발자의 매개중심성과 개발자의 커밋수와의 관계가 어떻게 달라지는지 알아보기 위해 리파지토리의 네트워크 사이즈 및 허브 존재유무의 조절효과를 분석해보았다. 분석 결과, 네트워크 사이즈가 클수록, 네트워크 내에 허브가 존재할수록 매개중심성과 개발자 커밋 수의 관련성이 커지는 것으로 나타났다. 오픈 소스 프로젝트는 자발적 조직의 형태로서, 운영자가 운영을 시작한 이후 시기가 지날수록 네트워크가 확대되는 형태로 나타나게 된다.
Cho and Gay[6]는 컴퓨터 기반 협력학습(CSCL: computer-supported collaborative learning)에서 네트워크 특성과 학생들의 성과에 대한 실증 분석을 실시하였다. 분석 결과, 네트워크의 주요한 역할을 하는 학생들의 학업성과가 높게 나타남을 밝혔다. Ortiz et al.
본 분석에서는 허브를 가지는 리파지토리와 그렇지 않은 리파지토리를 나누어 조절효과를 살펴보았다. 분석 결과, 허브수가 많은 리파지토리의 경우 매개중심성과 커밋수와의 관련성이 더욱 강해짐을 확인할 수 있다. [Table 9]는 1차항 모형(위계적 회귀분석 모델 3)을 대상으로 두 가지 그룹(허브 존재 vs.
Cross and Cummings[7]는 석유화학회사의 엔지니어와 컨설팅회사의 컨설턴트를 대상으로 지식중심산업에서의 인식(awareness)과 정보 (information) 네트워크 구조와 개인의 성과간의 관계에 대해 살펴보았다. 분석 결과를 통해 두 개의 네트워크 모두에서 매개중심성이 높을수록 개인의 성과가 좋아짐을 확인하였다. Zhang and Venkatesh[39]는 직원들의 온라인과 오프라인상에서의 커뮤니케이션 네트워크 구조와 성과(job performance)에 대한 연구를 실시하였다.
개발자들의 평균 깃허브 활동기간(Periodi)은 1,195일이였으며, 평균적으로 활동하는 리파지토리의 수(RepoNumberi)는 41개였다. 분석에 사용된 리파지토리의 평균 전체 커밋수 (TotalCommitj)는 948개였으며, 사이즈(Sizej)는 36,670킬로바이트인 것으로 나타났다. [Table 2]에서는 본 연구에서 활용되는 기본적인 변수의 기술통계 분석 결과를 확인할 수 있으며, [Table 3]에서는 변수간 상관관계 분석 결과를 확인할 수 있다.
셋째, 추가적으로 리파지토리의 운영자와 비운영자의 네트워크 중심구조를 t검정을 통해 분석한 결과, 운영자의 경우 연결·매개·근접 세 가지 네트워크 중심성 모두 큰 것으로 나타났다.
) 가 평균에서 3표준편차 이상 떨어지지 않은 개발자만을 대상으로 분석을 실시하였다. 이 중 관련 변수에 대한 데이터를 모두 확보할 수 있는 8,101개의 데이터(782개의 리파지토리에 소속된 8,101명의 개발자에 대한 데이터) 를 대상으로 분석을 시도한 결과([Table 2]참조), 개발자의 특정 리파지토리에서의 평균 커밋수(Commitij)는 56개, 평균 연결중심성 (DegCentralityij)은 0.027, 매개중심성(Bet Centralityij)은 0.124, 근접중심성(CloCentralityij) 은 0.555의 값을 가짐을 확인할 수 있었다. 개발자들의 평균 깃허브 활동기간(Periodi)은 1,195일이였으며, 평균적으로 활동하는 리파지토리의 수(RepoNumberi)는 41개였다.
주목할만한 점은, 세 가지 중심성 관련 모델 모두에서 1차항 모형에 비해 2차항 모형에 의한 설명력이 모두 증가하는 것으로 나타났다. 이를 통해 세 가지 중심성 모두 개발자의 커밋수에 미치는 영향이 선형이 아닌 비선형임을 확인할 수 있다. 또한 세 가지 중심성 중, 매개중심성이 1차항, 2차항 모형 모두에서 가장 설명력이 큰 것으로 나타났다.
특히, 다수의 공동개발자를 연결해 주는 역할을 수행하는 개발자의 매개중심성이 높을수록 그 개발자의 커밋수 또한 증가하는 경향이 강한 것으로 나타났다. 일반적으로 다수의 개발자와 협업을 많이 한 개발자 (연결중심성이 높은 개발자)가 리파지토리 내에서의 커밋수가 많을 것으로 기대하는 경향이 있으나, 본 분석 결과 매개중심성에 의한 설명력이 연결중심성에 의한 설명력보다 확연하게 높은 것으로 나타났다. 이러한 결과는 Abbasi et al.
셋째, 추가적으로 리파지토리의 운영자와 비운영자의 네트워크 중심구조를 t검정을 통해 분석한 결과, 운영자의 경우 연결·매개·근접 세 가지 네트워크 중심성 모두 큰 것으로 나타났다. 주목할만한 점은 다른 네트워크 중심성에 비해 매개 중심성에 있어서의 차이가 확연하게 큰 것으로 나타났다. 본 분석 결과는 오픈소스 프로젝트에서 리파지토리 운영자들에게는 다양한 주제로 모듈화된 개발자들을 연결해주는 역할이 중요함을 암시한다.
각 리파지토리 공동연구 네트워크 내에서의 연결·매개·근접 세 가지 중심성과 개발자의 커밋수와의 관련성을 살펴보기 위해 각 모델에서의 표준화 계수값을 산정하여 비교해 보았다([Table 4] 참조). 주목할만한 점은, 세 가지 중심성 관련 모델 모두에서 1차항 모형에 비해 2차항 모형에 의한 설명력이 모두 증가하는 것으로 나타났다. 이를 통해 세 가지 중심성 모두 개발자의 커밋수에 미치는 영향이 선형이 아닌 비선형임을 확인할 수 있다.
[2]의 연구결과 및 기업에서의 정보 흐름 네트워크에서 매개중심성이 높은 직원의 성과가 높게 나타난다는 Cross and Cummings[7]의 기존 연구결과 등과 동일한 결과라 볼 수 있다. 즉, 본 분석 결과를 통해 오픈소스 프로젝트의 개방형협업 네트워크에서도 매개중심성이 높은 개발자들의 역할이 중요함을 확인할 수 있었다. Burt[5]에 따르면, 매개중심성이 높은 노드는 다른 노드들을 서로 연결해주는 중개인(broker) 역할을 수행함으로써 네트워크 내에서의 정보 흐름을 제어 하는 역할을 수행하게 된다.
본 연구의 기여점은 다음과 같이 정리된다. 첫째, 사회연결망이론을 바탕으로 오픈소스 프로젝트의 자발적인 협업 네트워크의 특성을 통해 개방형협업의 성공 가능성을 설명하고자 시도하였다는 점에서 이론적 기여점을 찾을 수 있다. 특히, 기존 연구가 오픈소스 프로젝트의 네트워크(프로젝트) 수준에서의 특성을 통해 프로젝트의 성공여부에 초점을 맞추어 접근을 시도한 반면, 본 연구에서는 프로젝트 내의 개발자를 대상으로 네트워크 중심구조를 도출함으로써 활발한 기여를 하는 개발자의 네트워크 중심구조를 살펴보았다는 점에서 기존 연구와의 차별화를 꾀할 수 있다.
첫째, 연결·매개·근접 중심성 세 가지 모두 개발자의 커밋수와 긍정적인 관계를 가지는 것으로 나타났다.
아래 [Table 11] 및 [Figure 4]에서 제시하는 바와 같이, 운영자의 연결·매개·근접 중심성 모두 비운영자에 비해 통계적으로 유의한 수준에서 높은 수치를 가지는 것으로 나타났다. 특이할 만한 점은, 연결중심성과 근접중심성의 경우 운영자의 중심성이 비운영자에 비해 2배 이상 크지 않은 반면, 매개중심성은 운영자의 경우 비운영자에 비해 8배 이상 높은 것으로 나타났다. 기여율이 높은 개발자와 비슷하게 운영자의 경우에도 매개중심성이 상당히 높은 것으로 나타났다.
[Table 7]은 1차항 모형을 대상으로 두 가지 그룹에서의 매개중심성과 개발자 커밋수 관계에 있어서의 차이점을 분석하였으며, [Table 8]에서는 2차항 모형(위계적 회귀분석 모델 4)을 대상으로 동일한 분석을 실시하였다. 특이할만한 점은, 매개중심성과 개발자 커밋수와의 관계가 네트워크 사이즈가 적은 경우에는 2차항 모형이, 네트워크 사이즈가 큰 경우에는 1차항 모형이 적합함을 확인할 수 있었다([Figure 2] 참조).
또한 이러한 세 가지 관련성 모두 1차항이 아닌 2차항으로 설명할 경우 설명력이 더욱 증가하는 것으로 나타났다. 특히, 다수의 공동개발자를 연결해 주는 역할을 수행하는 개발자의 매개중심성이 높을수록 그 개발자의 커밋수 또한 증가하는 경향이 강한 것으로 나타났다. 일반적으로 다수의 개발자와 협업을 많이 한 개발자 (연결중심성이 높은 개발자)가 리파지토리 내에서의 커밋수가 많을 것으로 기대하는 경향이 있으나, 본 분석 결과 매개중심성에 의한 설명력이 연결중심성에 의한 설명력보다 확연하게 높은 것으로 나타났다.
본 연구를 통해 개방형협업의 성공을 위해서는 매개중심성이 높은 개발자를 중점적으로 관리할 필요성이 커짐을 확인하였다. 특히, 협업 네트워크가 진화할수록 매개 중심성을 가지는 개발자의 중요성은 더욱 커지는 것으로 나타났다. 따라서, 이러한 개방형협업의 효율적 운영을 위해서는, 매개 중심성이 높은 개발자에게 특정 권한을 부여하는 등의 정책이 필요할 것으로 판단된다.
후속연구
개방형협업의 중요성이 날로 커지고 있는 현 상황에서 깃허브 오픈소스 프로젝트의 성공을 위한 개발자의 기여도에 대한 분석은 시사하는 바가 클 것으로 기대된다. 본 연구는 오픈소스 프로젝트뿐만 아니라 더 나아가 개방형협업의 형태로 이루어질 다양한 프로젝트의 성공을 위한 효율적인 운영에 있어 가이드라인을 제공해줄 수 있을 것으로 기대된다.
둘째, 본 연구는 기존의 사회과학 연구에서의 방법론에서 다소 벗어나 설문조사가 아닌 실제데이터를 통한 연구라는 점과 개인의 특성뿐만 아니라 개인간의 상호작용에 의한 패턴을 살펴보고자 하는 점에서 차별화를 꾀할 수 있다. 즉, 최근 각광받고 있는 빅데이터의 일환인 웹데이터를 자동으로 수집․분석하여 사회 현상을 살펴보았다는 점과 개발자․리파지토리 자체가 가지는 특성뿐만 아니라 개발자간의 상호협력 관계 또한 분석의 대상으로 포함한 점 등을 기존연구와의 차이점으로 볼 수 있다.
개방형협업의 중요성이 날로 커지고 있는 현 상황에서 깃허브 오픈소스 프로젝트의 성공을 위한 개발자의 기여도에 대한 분석은 시사하는 바가 클 것으로 기대된다. 본 연구는 오픈소스 프로젝트뿐만 아니라 더 나아가 개방형협업의 형태로 이루어질 다양한 프로젝트의 성공을 위한 효율적인 운영에 있어 가이드라인을 제공해줄 수 있을 것으로 기대된다. 본 연구를 통해 개방형협업의 성공을 위해서는 매개중심성이 높은 개발자를 중점적으로 관리할 필요성이 커짐을 확인하였다.
본 연구에서 더 나아가 리파지토리의 진화 과정에 대한 시계열 데이터를 수집함으로써 공동연구 네트워크 진화 형태를 살펴보고, 프로젝트의 성공을 위해 중요한 역할을 수행하는 기여자들의 네트워크 중심구조 변화를 살펴보는 것도 향후 연구로서 의미가 있을 것으로 판단된다.
또한 앞서 말한 바와 같이, 기존 연구에서는 오픈소스 프로젝트의 성공적인 운영을 위한 각 개발자 성과에 초점을 맞춘 연구는 거의 다루고 있지 않다. 본 연구에서는 어떤 네트워크 특성을 가진 개발자의 협업에 대한 기여도가 높은지를 파악함으로써 향후 성공적인 오픈소스 프로젝트 운영을 위한 경영, 정책, 플랫폼 디자인 등에 있어서의 시사점을 제공해 줄 수 있을 것으로 기대된다.
질의응답
핵심어
질문
논문에서 추출한 답변
논문의 저자가 공동연구 네트워크 형태와 참여자들의 자발적 참여에 대해 알아보기 위해 사용한 데이터는 무엇인가?
본 연구에서는 사회연결망이론을 바탕으로 성공적인 자발조직의 형태에 초점을 맞추어 공동연구 네트워크 형태와 참여자들의 자발적 참여에 대해 살펴보고자 한다. 이를 위해 오픈소스 프로젝트를 진행할 수 있는 대표적인 인터넷 기반 플랫폼 깃허브(GitHub)의 실제 데이터를 수집하여 실증분석을 실시하고자 한다. 2008년 만들어진 깃허브는 2014년 340만 명 이상의 소프트웨어 개발자들에 의해 활용되고 있으며, 1,000만개 이상의 리파지토리(repository : 프로젝트의 소스코드 저장소)가 운영되고 있다[40].
개방형 협업의 예로는 무엇이 있는가?
개방형협업이란 “내부 자원을 이용하던 방식을 벗어나서 인터넷을 이용하여 외부에 있는 다수의 자원을 이용하는 방식”으로 정의된다[19]. 과학자 집단과 주요기업을 연결함으로써 각종 연구개발 과제를 해결해주도록 지원해주는 이노센티브(InnoCentive), 크라우드펀딩을 활용하여 개인이 원하는 비즈니스를 위한 펀드를 마련해주는 퀵스타터닷컴(KickStarter.com), 오픈 백과사전인 위키피디아(Wikipedia) 등 다양한 형태의 개방형 협업이 존재한다. 이처럼 집단지성을 통한 개방형협업의 활용 및 중요성이 증가하고 있음에도 불구하고, 개방형협업이 이루어지는 프로세스 및 네트워크 구조에 대한 연구는 비교적 제한된 편이다.
개방형협업이란 무엇인가?
발전된 정보통신기술은 개인의 창의적 아이디어를 생성·교류·공유·활용할 수 있는 오픈 플랫폼 역할을 수행하여 상호간 협력이 용이한 구조를 제공함으로써 개방형협업(Open Collaboration)을 가능하게 한다. 개방형협업이란 “내부 자원을 이용하던 방식을 벗어나서 인터넷을 이용하여 외부에 있는 다수의 자원을 이용하는 방식”으로 정의된다[19]. 과학자 집단과 주요기업을 연결함으로써 각종 연구개발 과제를 해결해주도록 지원해주는 이노센티브(InnoCentive), 크라우드펀딩을 활용하여 개인이 원하는 비즈니스를 위한 펀드를 마련해주는 퀵스타터닷컴(KickStarter.
참고문헌 (40)
Abbasi, A., Altmann, J., and Hossain, L., "Identifying the effects of co-authorship networks on the performance of scholars : A correlation and regression analysis of performance measures and social network analysis measures," Journal of Informetrics, Vol. 5, No. 4, pp. 594-607, 2011.
Abbasi, A., Hossain, L., and Leydesdorff, L., "Betweenness centrality as a driver of preferential attachment in the evolution of research collaboration networks," Journal of Informetrics, Vol. 6, No. 3, pp. 403-412, 2012.
Barabasi, A. L., Linked : How everything is connected to everything else and what it means for business, science, and everyday life : Basic Books, 2014.
Borgatti, S., "Centrality and AIDS," Connections, Vol. 18, No. 1, pp. 112-114, 1995.
Burt, R. S., Structural holes : The social structure of competition, Cambridge, MA : Harvard University Press, 1995.
Cho, H., Gay, G., Davidson, B., and Ingraffea, A., "Social networks, communication styles, and learning performance in a CSCL community," Computers and Education, Vol. 49, No. 2, pp. 309-329, 2007.
Cross, R. and Cummings, J. N., "Tie and network correlates of individual performance in knowledge-intensive work," Academy of Management Journal, Vol. 47, No. 6, pp. 928-937, 2004.
Crowston, K. and Howison, J., "The social structure of free and open source software development," First Monday, Vol. 10, No. 2, 2005.
Dabbish, L., Stuart, C., Tsay, J., and Herbsleb, J., "Social coding in github : transparency and collaboration in an open software repository," Proceedings of the ACM 2012 conference on Computer Supported Cooperative Work, ACM 2012, pp. 1277-1286, 2012.
Freeman, L. C., "Centrality in social networks conceptual clarification," Social Networks, Vol. 1, No. 3, pp. 215-239, 1979.
Gargiulo, M., Ertug, G., and Galunic, C., "The two faces of control : Network closure and individual performance among knowledge workers," Administrative Science Quarterly, Vol. 54, No. 2, pp. 299-333, 2009.
Gousios, G. and Spinellis, D., "GHTorrent : Github's data from a firehose," Paper presented at the Mining Software Repositories (MSR), 2012 9th IEEE Working Conference on, 2012.
Grewal, R., Lilien, G. L., and Mallapragada, G., "Location, location, location : How network embeddedness affects project success in open source systems," Management Science, Vol. 52, No. 7, pp. 1043-1056, 2006.
Huang, M., Ahn, J., and Jahng, J., "Patterns of Collaboration Networks : Coauthorship Analysis of MIS Quarterly from 1996 to 2004," The Journal of Society for e-Business Studies, Vol. 13, No. 4, pp. 193-207, 2008.
Kidane, Y. H. and Gloor, P. A., "Correlating temporal communication patterns of the Eclipse open source community with performance and creativity," Computational and mathematical organization theory, Vol. 13, No. 1, pp. 17-27, 2007.
Kim, Y. H., Social Network Analysis, Parkyoungsa, Seoul, 2007.
Kim, Y. T., "Analysis of the employment channels of disabled employees : Focus on social network," Disability and Employment, Vol. 21, No. 3, pp. 5-26, 2011.
Krishnamurthy, S., "Cave or community? : An empirical examination of 100 mature open source projects," First Monday, Vol. 7, No. 6, 2002.
Lee, J. K., Open collaboration, INITIAL COMMUNICATIONS Corp, Seoul, 2012.
Lee, J. and Kim, S., "Exploring the role of social networks in affective organizational commitment : Network centrality, strength of ties, and structural holes," The American Review of Public Administration, Vol. 41, No. 2, pp. 205-223, 2011.
Madey, G., Freeh, V., and Tynan, R., "The open source software development phenomenon : An analysis based on social network theory," AMCIS 2002 Proceedings, p. 247, 2002.
Mitchell, J. C., The concept and use of social networks, Bobbs-Merrill, 1969.
Mizruchi, M. S., Stearns, L. B., and Fleischer, A., "Getting a bonus : social networks, performance, and reward among commercial bankers," Organization Science, Vol. 22, No. 1, pp. 42-59, 2011.
Oh, W. and Jeon, S., "Membership herding and network stability in the open source community : The Ising perspective," Management Science, Vol. 53, No. 7, pp. 1086-1101, 2007.
Ortiz, M. R., Hoyos, J. R. C., and Lopez, M. G. R., "The social networks of academic performance in a student context of poverty in Mexico," Social networks, Vol. 26, No. 2, pp. 175-188, 2004.
Park, J. H., Cho, Y. H., and Kim, J. K., "Social network : A novel approach to new customer recommendations," Journal of Intelligence and Information Systems, Vol. 15, No. 1, pp. 123-140, 2009.
Pil, F. K. and Leana, C., "Applying organizational research to public school reform : The effects of teacher human and social capital on student performance," Academy of Management Journal, Vol. 52, No. 6, pp. 1101-1124, 2009.
Scott, J., Social network analysis : A handbook, Sage, 1991.
Simon, H. A., The architecture of complexity, Springer, 1991.
Sin, H. P., Nahrgang, J. D., and Morgeson, F. P., "Understanding why they don't see eye to eye : An examination of leadermember exchange (LMX) agreement," Journal of Applied Psychology, Vol. 94 No. 4, pp. 1048-1057, 2009.
Singh, P. V., Tan, Y., and Mookerjee, V., "Network Effects : The Influence of Structural Capital on Open Source Project Success," MIS Quarterly, Vol. 35, No. 4, pp. 813-829, 2011.
Sparrowe, R. T., Liden, R. C., Wayne, S. J., and Kraimer, M. L., "Social networks and the performance of individuals and groups," Academy of management Journal, Vol. 44, No. 2, pp. 316-325, 2001.
Takhteyev, Y. and Hilts, A., "Investigating the geography of open source software through GitHub," Working Paper, 2010.
Thung, F., Bissyande, T. F., Lo, D., and Jiang, L., "Network structure of social coding in GitHub," Paper presented at the Software Maintenance and Reengineering (CSMR), European Conference on, 2013.
Yang, H. L. and Tang, J. H., "Effects of social network on students' performance : a web-based forum study in Taiwan," Journal of Asynchronous Learning Networks, Vol. 7, No. 3, pp. 93-107, 2003.
Zhang, X. and Venkatesh, V., "Explaining employee job performance : the role of online and offline workplace communication networks," Mis Quarterly, Vol. 37, No. 3, pp. 695-722, 2013.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.