$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

소의 경제형질 관련 유전자 네트워크 분석 시스템 구축
Construction of Gene Network System Associated with Economic Traits in Cattle 원문보기

생명과학회지 = Journal of life science, v.26 no.8 = no.196, 2016년, pp.904 - 910  

임다정 (농촌진흥청 국립축산과학원) ,  김형용 (인실리코젠) ,  조용민 (농촌진흥청 국립축산과학원) ,  채한화 (농촌진흥청 국립축산과학원) ,  박종은 (농촌진흥청 국립축산과학원) ,  임규상 (농촌진흥청 국립축산과학원) ,  이승수 (농촌진흥청 국립축산과학원)

초록
AI-Helper 아이콘AI-Helper

가축의 경제형질은 대부분 복합형질 상태이며, 많은 유전자와 생물대사회로에 의해 조절된다. 시스템 생물학은 생명현상을 하나의 복합체로 가정하고, 형질에 관여하는 유전자들에 대한 기능적 관계를 분석하는 학문이다. 유전자 네트워크는 시스템 생물학의 하나의 연구분야로써, 유전자 기능의 상관관계를 지도화하여 오믹스 데이터를 통합 분석하여 해석한다. 유전자 네트워크는 단백질-단백질 상호작용, 공발현, 조절인자, 유전자형 기반으로 다양한 유전자의 기능적 상호작용을 표현할 수 있다. 또한, 네트워크를 구성하기 위해서는 유전자 간 연결 정도에 가중치를 두거나, 인접한 유전자 수 계산 등의 네트워크 토폴로지 알고리즘이 적용된다. 가축에서는 이러한 연구가 단형질에 대한 유전자 발현, 단백질 상호작용 등에 국한되어 있는 실정이다. 본 논문에서는 유전자 공발현 네트워크와 단백질-단백질 상호작용 네트워크 분석법을 확립하고 소의 102개 경제형질에 대하여 유전자 네트워크 분석 결과에 대한 데이터베이스를 구축하였다. 102개의 경제형질은 Animal Trait Ontology (ATO) 명명법에 의하여 분류하여 제공하였다. 각 형질에 포함된 유전자 리스트는 Animal QTL database에서 제공하는 양적유전형질좌위의 물리적 위치에 존재하는 유전자군을 추출하였다. 유전자 공발현 네트워크는 R의 WGCNA 패키지를 활용하였으며, 단백질-단백질 상호작용 네트워크는 Human Protein Reference Database에서 사람과 소의 orthologous group에 포함된 유전자를 대상으로 단백질 상호작용 관계를 규명하였다. 네트워크 분석 결과는 관계형 테이블로 구축하였으며, 구축한 데이터베이스를 관련 연구진에게 공유하기 위하여 웹 기반의 유전자 네트워크 가시화 시스템을 구현하였다(http://www.nabc.go.kr/cg). 웹 데이터베이스 구현을 위하여 Ontle 프로그램을 활용하여 다양한 방식으로 유전자 네트워크 가시화 작업을 수행하였다. 이 시스템을 통하여 사용자는 관련 형질의 후보 유전자군 탐색, 유전자 네트워크 분석 결과, 유전자 사이의 기능적 연결관계를 손쉽게 살펴볼 수 있게 될 것이다.

Abstract AI-Helper 아이콘AI-Helper

Complex traits are determined by the combined effects of many loci and are affected by gene networks or biological pathways. Systems biology approaches have an important role in the identification of candidate genes related to complex diseases or traits at the system level. The gene network analysis...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 형태를 관찰하고, 3) 가장 많이 연결되어 있는 허브 유전자군을 선별하여 실험 검증을 수행한 결과를 소개한다. 사용자는 소 유전체 네트워크 분석 시스템에서 ‘Co-expre- ssion Network’ 메뉴를 선택하여 Trait list의 category 선택 창에서 ‘Meat Traits’의 ‘Marbling score’를 선택한다.
  • 대부분의 생물학적 네트워크에서 도수 분포는 멱함수 분포(p(k) ~ kr)를 따르고 있기 때문에 척도 없는 네트워크라 고도한다[1]. 각 형질에 대하여 power-law function을 활용하여 도수 분포도를 구성하여 해당법칙에 맞는지 확인하였다.
  • 구축된 유전자 공발현 네트워크, 단백질-단백질 상호작용네트워크 정보는 관계형 데이터베이스로 구축하고, 웹 인터페이스 화하기 위하여, Ontle 프로그램을 이용하였다. Ontlee “웹기반의 온톨로지 편집 운영 시스템”[12]으로, 네트워크 데이터를 관계형 데이터베이스의 노드, 엣지, 엣지타입 테이블로 관리하며, 특정한 노드와 인접한 노드를 연결 수준에 따라 하나의 웹 화면에 가시화하여 출력하고, 노드와 엣지 정보를 편집할 수 있는 인터페이스를 제공한다.
  • 주로 단백질 상호작용 정보는 효모에서 가장 많이 존재하며, 동물 특히 가축을 대상으로 단백질 상호작용 정보에 대한 데이터베이스는 존재하지 않는다. 따라서 본 연구에서는 human pro- tein-protein interaction (HPRD) 정보를 활용하여 각 유전자에 대한 단백질 상호작용 정보를 추출하여 단백질 상호작용네트워크를 구축하였다. HPRD는 기보고된 논문을 바탕으로 전문가에 의해 단백질 상호작용을 분석한 데이터베이스이다 [18].
  • 이는 R 통계프로그램의 ‘affy’ 패키지를 활용하여 RMA (Robust Multiarray Average) 기법을 활용하였다[6]. 또한, RMA를 통해 얻어진 발현값은 로그값으로 변환시켜 추후 발현 네트워크 분석에 사용하였다. 공발현 네트워크는 유전자 하나하나는 노드로 표현되며, 유전자의 발현패턴이 비슷하다면 선으로 연결하여 표현하게 된다.
  • 특정 유전자(Gene)는 양쪽 네트워크에 모두 포함될 수 있으며, 형질(Trait) 테이블을 참고하여, 특정 형질과 관련된 유전자를 탐색할 수 있다. 또한, 별도의 데이터로드 프로그램을 작성하여, 구축된 유전자 공 발현네트워크, 단백질-단백질 상호작용 네트워크 데이터를 OBO (Open Biomedical Ontologies) 형식으로 변환한 후[21], 본 모델에 맞도록 로드하고, 웹 사용자가 가시화된 네트워크 정보를 탐색할 수 있도록 웹 어플리케이션을 구현하였다. 이를 위하여 파이썬 프로그래밍 언어와 장고(Django) 웹프레임워크, 마이시퀄(MySQL) 데이터베이스가 사용되었다.
  • ‘Exterior’, ‘Health’, ‘Meat traits’, ‘Milk traits’, ‘Production’, ‘Reproduction’의 6개 대분류에 따라 17개 중분류, 102개 소분류로 경제형질이 나눠진다. 또한, 소의 경제형질 관련 유전자군을 추출하기 위하여 Animal QTL database (http://www.genome.iastate.edu/cgi-bin/ QTLdb/BT/index)에서 ‘QTL location by bp’ 파일을 활용하여 각 형질에 대한 물리적 위치를 파악하여, 해당 형질의 물리적 위치에 존재하는 유전자군을 추출하였다.
  • 소의 마이크로어레이 정보는 GEO series (GSE)15544, GSE15342, GSE 13725, GSE6918, GSE10695, GSE12327, GSE9256, GSE12688, GSE11495, GSE11312, GSE7360, GSE9344, GSE8442이다. 모든 마이크로어레이의 CEL 파일들을 대상으로 바탕값 보정 및 표준화 등 데이터 전처리를 수행한다. 이는 R 통계프로그램의 ‘affy’ 패키지를 활용하여 RMA (Robust Multiarray Average) 기법을 활용하였다[6].
  • 본 논문에서는 소의 단일형질에 대하여 유전자 네트워크를 구축하고 분석한 결과를 확대하여 102개 경제형질에 대하여 유전자 공발현 네트워크 및 단백질 상호작용 네트워크 분석 결과에 대하여 데이터베이스를 구축하였으며, 웹 시스템으로 구현하였다. 이를 통해 축산분야에서 다양한 경제형질에 연관된 유전자군 탐색을 위해 중요한 유전자군을 위주로 접근 가능하여 실험 검증에 적용할 수 있게 되었다.
  • HPRD는 기보고된 논문을 바탕으로 전문가에 의해 단백질 상호작용을 분석한 데이터베이스이다 [18]. 본 시스템에서는 소의 유전자에 대한 단백질 상호작용을 분석해야 하므로, NCBI에서 제공하는 Homologene 데이터베이스(http://www.ncbi.nlm.nih.gov/homologene)를 활용하여 종간 보존적인 그룹에 따라 HPRD에 존재하는 Human protein에 대응하는 소의 유전자를 찾은 후에, 관련 단백질 상호작용 정보를 추출하였다.
  • Ontlee “웹기반의 온톨로지 편집 운영 시스템”[12]으로, 네트워크 데이터를 관계형 데이터베이스의 노드, 엣지, 엣지타입 테이블로 관리하며, 특정한 노드와 인접한 노드를 연결 수준에 따라 하나의 웹 화면에 가시화하여 출력하고, 노드와 엣지 정보를 편집할 수 있는 인터페이스를 제공한다. 본 연구에서는 소의 경제 형질 유전자 네트워크 분석 시스템 목적에 맞도록 Ontle 의 데이터 모델을 확장하여, 통합하였다(Fig. 1). Ontlee 유전자 공발현 네트워크, 단백질-단백질 상호작용 네트워크의 2개 레코드를 포함한다.
  • 05)를 보이는 것을 확인할 수 있었다[15]. 뿐만 아니라, 본 시스템을 활용하여 단백질 상호작용 네트워크 분석을 통해 지방대사에 의해 한우의 근내지방 형성을 촉진시키는허브 유전자군(PPARγ, C/EBPα, RUNXT1) 및 억제 유전자 (RXRA, CAMK2A)를 규명하였다[16].
  • 소개한다. 사용자는 소 유전체 네트워크 분석 시스템에서 ‘Co-expre- ssion Network’ 메뉴를 선택하여 Trait list의 category 선택 창에서 ‘Meat Traits’의 ‘Marbling score’를 선택한다. 결과 화면은 ‘Marbling score’라는 유전좌위에 존재하는 유전자 리스트에 대하여 유전자 심볼, 유전자 설명, 염색체, 도수, 매개 중심성, 근접중심성, 연결중심성 값이 제공된다.
  • 사용자는 연결 수준을 지정할 수 있으며, level 2는 두 번 건너서 연결된 노드를, 레벨 3은 세 번 건너서 연결된 노드를 모두 추출한다. 추출된 네트워크는 DOT 그래프 형식[5]으로 변환된 후, 이미지 파일과 HTML 파일을 각각 생성하고 결합하여 화면에 출력한다. 출력 화면에서는 연결 가중치(강도)에 따라 엣지 색깔을 다르게 표시한다.
  • 추출된 유전자 리스트를 대상으로 네트워크 전체의 토폴로지(topology)를 관찰하기 위해서 파이썬에서 제공하는 net- workx 모듈을 활용하여 노드의 도수, 근접 중심성, 매개 중심 성값을 계산하였다. 노드의 도수는 유전자가 다른 유전자들과 연결된 정도를 의미한다.
  • 3은 본 구축 시스템에서 네트워크 정보를 웹 가시화하는 방법과 화면 예제를 표시한다. 특정 노드(유전자) 선택시, 해당 노드와 연결된 노드를 그래프 연산을 통해 관계형 데이터베이스에서 추출한다. 사용자는 연결 수준을 지정할 수 있으며, level 2는 두 번 건너서 연결된 노드를, 레벨 3은 세 번 건너서 연결된 노드를 모두 추출한다.

대상 데이터

  • gov/geo/). 소의 마이크로어레이 정보는 GEO series (GSE)15544, GSE15342, GSE 13725, GSE6918, GSE10695, GSE12327, GSE9256, GSE12688, GSE11495, GSE11312, GSE7360, GSE9344, GSE8442이다. 모든 마이크로어레이의 CEL 파일들을 대상으로 바탕값 보정 및 표준화 등 데이터 전처리를 수행한다.
  • 유전자들을 연결한 네트워크이다. 유전자 발현 micro- array 데이터 전처리를 위하여 NCBI의 GEO (Gene Expression Omnibus) 데이터로부터 소의 마이크로어레이 정보를 다운로드 받는다(http://www.ncbi.nlm.nih.gov/geo/). 소의 마이크로어레이 정보는 GEO series (GSE)15544, GSE15342, GSE 13725, GSE6918, GSE10695, GSE12327, GSE9256, GSE12688, GSE11495, GSE11312, GSE7360, GSE9344, GSE8442이다.
  • 또한, 별도의 데이터로드 프로그램을 작성하여, 구축된 유전자 공 발현네트워크, 단백질-단백질 상호작용 네트워크 데이터를 OBO (Open Biomedical Ontologies) 형식으로 변환한 후[21], 본 모델에 맞도록 로드하고, 웹 사용자가 가시화된 네트워크 정보를 탐색할 수 있도록 웹 어플리케이션을 구현하였다. 이를 위하여 파이썬 프로그래밍 언어와 장고(Django) 웹프레임워크, 마이시퀄(MySQL) 데이터베이스가 사용되었다. 사용자는 메인 메뉴를 통해 네트워크를 선택하고, 관심 형질을 선택한 후, 해당 형질과 관련된 유전자의 목록을 열람한다.

이론/모형

  • 공발현 네트워크는 공 발현되는 유전자 그룹을 찾고, 해당 그룹에 찾고자 하는 형질과 관련성을 가지는지, 해당되는 유전자 그룹의 기능(예: 대사회로, 유전자 온톨로지 등)을 규명하는 것이 중요하다. 공 발현되는 유전자 네트워크 분석은 R 통계 프로그램의 WGCNA (Weighted Gene Co-expression Network Analysis) 패키지에서 ‘hard thresholding’ 알고리즘을 활용하여 각 형질에 대하여 공발현되는 유전자 그룹을 추출하였다[19].
  • 모든 마이크로어레이의 CEL 파일들을 대상으로 바탕값 보정 및 표준화 등 데이터 전처리를 수행한다. 이는 R 통계프로그램의 ‘affy’ 패키지를 활용하여 RMA (Robust Multiarray Average) 기법을 활용하였다[6]. 또한, RMA를 통해 얻어진 발현값은 로그값으로 변환시켜 추후 발현 네트워크 분석에 사용하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (23)

  1. Barabasi, A. L. and Albert, R. 1999. Emergence of scaling in random networks. Science 286, 509-512. 

  2. Barabasi, A. L. and Oltvai, Z. N. 2004. Network biology: understanding the cell's functional organization. Nat. Rev. Genet. 5, 101-113. 

  3. Brandes, U. 2001. A faster algorithm for betweenness centrality. J. Math. Sociol. 25, 163-177. 

  4. Carter, S. L., Brechbühler, C. M., Griffin, M. and Bond, A. T. 2004. Gene co-expression network topology provides a framework for molecular characterization of cellular state. Bioinformatics 20, 2242-2250. 

  5. Ellson, J., Gansner, E., Koutsofios, L., North, S. C. and Woodhull, G. 2001. Graph Drawing . pp. 483-484. Springer Berlin Heidelberg, Germany. 

  6. Gandhi ,T., Zhong, J., Mathivanan, S., Karthick, L., Chandrika, K., Mohan, S., Sharma, S., Pinkert, S., Nagaraju, S. and Periaswamy, B. 2006. Analysis of the human protein interactome and comparison with yeast, worm and fly interaction datasets. Nat. Genet. 38, 285-293. 

  7. Gautier, L., Cope, L., Bolstad, B. and Irizarry, R. 2004. affy--analysis of Affymetrix GeneChip data at the probe level. Bioinformatics 20, 307. 

  8. Irizarry, R. A., Bolstad, B. M., Collin, F., Cope, L. M., Hobbs, B. and Speed, T. P. 2003. Summaries of Affymetrix Gene-Chip probe level data. Nucleic Acids Res. 31, e15-e15. 

  9. Hecker, M., Lambeck, S., Toepfer, S., Van Someren, E. and Guthke, R. 2009. Gene regulatory network inference: data integration in dynamic models—a review. Biosystems 96, 86-103. 

  10. Hughes, L. M., Bao, J., Hu, Z. L., Honavar, V. and Reecy, J. M. 2008. Animal trait ontology: The importance and usefulness of a unified trait vocabulary for animal species. J. Anim. Sci. 86, 1485-1491. 

  11. Jiang, Z., Michal J. J., Chen, J., Daniels, T. F., Kunej, T., Garcia, M. D., Gaskins, C. T., Busboom, J. R., Alexander, L. J. and Wright, R. W. J. 2009. Discovery of novel genetic networks associated with 19 economically important traits in beef cattle. Int. J. Biol. Sci. 5, 528-542 

  12. Kang, B, and Kim, H. 2011. Web-based ontology edition operation system. PCT/KR2011/000595 

  13. Kim, H., Shim, J. E., Shin, J. and Lee, I. 2015. EcoliNet: a database of cofunctional gene network for Escherichia coli. Database, bav001. 

  14. Kim, N. K., Lim, D., Lee, S. H., Cho, Y. M., Park, E. W., Lee, C. S. and Yoon, D. 2011. Heat shock protein B1 and its regulator genes are negatively correlated with intramuscular fat content in the Longissimus Thoracis muscle of Hanwoo (Korean cattle) steers. J. Agric. Food Chem. 59, 5657-5664. 

  15. Lim, D., Lee, S. H., Kim, N. K., Cho, Y. M., Chai, H. H., Seong, H. H. and Kim, H. 2013. Gene Co-expression Analysis to Characterize Genes Related to Marbling Trait in Hanwoo (Korean) Cattle. Asian Australas. J. Anim. Sci. 26, 19. 

  16. Lim, D., Kim, N. K., Park, H. S., Lee, S. H., Cho, Y. M., Oh, S. J. and Kim, H. 2011. Identification of candidate genes related to bovine marbling using protein-protein interaction networks. Int. J. Biol. Sci. 7, 992-1002. 

  17. Obayashi, T., Hayashi, S., Shibaoka, M., Saeki, M., Ohta, H. and Kinoshita, K. 2008. COXPRESdb: a database of coexpressed gene networks in mammals. Nucleic Acids Res. 36, 77-82. 

  18. Peri, S., Navarro, J. D., Kristiansen, T. Z., Amanchy, R., Surendranath, V., Muthusamy, B. and Rashmi, B. P. 2004. Human protein reference database as a discovery resource for proteomics. Nucleic Acids Res. 32, 497-501. 

  19. Peter, L. and Steve, H. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics 9, 559. 

  20. Reverter, A., Hudson, N., Wang, Y., Tan, S., Barris, W., Byrne, K., McWilliam, S., Bottema, C., Kister, A. and Greenwood, P. 2006. A gene coexpression network for bovine skeletal muscle inferred from microarray data. Physiol. Genomics 28, 76. 

  21. Smith, B., Ashburner, M., Rosse, C., Bard, J., Bug, W., Ceusters, W. and Leontis, N. 2007. The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration. Nat. Biotechnol. 25, 1251-1255. 

  22. Stelzl, U., Worm, U., Lalowski, M., Haenig, C., Brembeck, F. H., Goehler, H., Stroedicke, M., Zenkner, M., Schoenherr, A. and Koeppen, S. 2005. A Human Protein-Protein Interaction Network: A Resource for Annotating the Proteome. Cell 122, 957-968. 

  23. Szklarczyk, D., Franceschini, A., Kuhn, M., Simonovic, M., Roth, A., Minguez, P. and Jensen, L. J. 2010. The STRING database in 2011: functional interaction networks of proteins, globally integrated and scored. Nucleic Acids Res. 39, 561-568. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로