폐암과 간암은 세계적으로 암으로 인해 사망하는 요인 중 가장 높은 순위 중에 속한다. 따라서 이 두가지 암에서 발현되는 유전자를 식별해 내는 일은 새로운 신약을 개발하는데 있어서 필수적이다. Next Gen Sequencing(NGS) 기술의 발전으로 암 조직과 관련된 많은 메신저 RNA(mRNA) 시퀀싱 데이터가 존재하지만, 암에서 특이적으로 발현하는 새로운 유전자를 식별하기 위해서 이에 최적화된 ...
폐암과 간암은 세계적으로 암으로 인해 사망하는 요인 중 가장 높은 순위 중에 속한다. 따라서 이 두가지 암에서 발현되는 유전자를 식별해 내는 일은 새로운 신약을 개발하는데 있어서 필수적이다. Next Gen Sequencing(NGS) 기술의 발전으로 암 조직과 관련된 많은 메신저 RNA(mRNA) 시퀀싱 데이터가 존재하지만, 암에서 특이적으로 발현하는 새로운 유전자를 식별하기 위해서 이에 최적화된 데이터 처리 방법의 개발이 필요하다. 본 연구는 최적화된 데이터 처리 방법을 개발하기 위한 일환으로 현재 정렬 도구로 가장 많이 활용되는 도구인 bowtie2와 Kallisto를 그들이 바탕을 둔 서로 다른 알고리즘을 기반으로 그 효용성을 분석하였다. 두 알고리즘간의 효용성 분석은 정상 세포와 폐 암, 간 암 조직에 대한 mRNA 시퀀싱 데이터에 burrows-wheeler transform 기반의 정렬 도구인 bowtie2와 transcriptome de Bruijn graph 기반의 의사 정렬 도구인 Kallisto를 활용하여 얻어지는 결과를 비교 분석함으로써 진행하였다. 폐 암, 간 암 세포에 대한 mRNA 서열 데이터에서 뉴클레오타이드 서열을 fasta/fastq 파일로 추출하여 정량화한다. Kallisto는 직접적으로 TPM(Transcripts Per Million) 값을 제공하는 반면, bowtie2는 발현량으로 값을 제공하므로 bowtie2에서의 TPM 값은 Sequence Alignment Map(SAM)을 R의 Rsubread 패키지를 사용하여 처리한 후 파이썬으로 TPM 값을 도출하여 비교하였다. Kallisto와 bowtie2 사이의 TPM과 발현량의 차이는 Kallisto에 내장된 quality control을 목적으로 하는 bias correction 기능에 의해 나타난다. 이 두가지 데이터 처리 방법을 quality control에 대한 별도의 조치없이 동일하게 일반적인 실험기준으로 잘 알려진 폐 암의 바이오마커를 사용하여 분석한 결과, transcriptome de Bruijn graph 알고리즘 기반의 의사 정렬 도구인 Kallisto가 결과생산의 속도도 빠르고 결과의 정확성에 있어서도 bowtie2 보다 우수하다는 결론을 얻었다. 이러한 결론은 간 암 바이오마커를 적용하여 분석한 결과를 통해서도 입증되었다.
폐암과 간암은 세계적으로 암으로 인해 사망하는 요인 중 가장 높은 순위 중에 속한다. 따라서 이 두가지 암에서 발현되는 유전자를 식별해 내는 일은 새로운 신약을 개발하는데 있어서 필수적이다. Next Gen Sequencing(NGS) 기술의 발전으로 암 조직과 관련된 많은 메신저 RNA(mRNA) 시퀀싱 데이터가 존재하지만, 암에서 특이적으로 발현하는 새로운 유전자를 식별하기 위해서 이에 최적화된 데이터 처리 방법의 개발이 필요하다. 본 연구는 최적화된 데이터 처리 방법을 개발하기 위한 일환으로 현재 정렬 도구로 가장 많이 활용되는 도구인 bowtie2와 Kallisto를 그들이 바탕을 둔 서로 다른 알고리즘을 기반으로 그 효용성을 분석하였다. 두 알고리즘간의 효용성 분석은 정상 세포와 폐 암, 간 암 조직에 대한 mRNA 시퀀싱 데이터에 burrows-wheeler transform 기반의 정렬 도구인 bowtie2와 transcriptome de Bruijn graph 기반의 의사 정렬 도구인 Kallisto를 활용하여 얻어지는 결과를 비교 분석함으로써 진행하였다. 폐 암, 간 암 세포에 대한 mRNA 서열 데이터에서 뉴클레오타이드 서열을 fasta/fastq 파일로 추출하여 정량화한다. Kallisto는 직접적으로 TPM(Transcripts Per Million) 값을 제공하는 반면, bowtie2는 발현량으로 값을 제공하므로 bowtie2에서의 TPM 값은 Sequence Alignment Map(SAM)을 R의 Rsubread 패키지를 사용하여 처리한 후 파이썬으로 TPM 값을 도출하여 비교하였다. Kallisto와 bowtie2 사이의 TPM과 발현량의 차이는 Kallisto에 내장된 quality control을 목적으로 하는 bias correction 기능에 의해 나타난다. 이 두가지 데이터 처리 방법을 quality control에 대한 별도의 조치없이 동일하게 일반적인 실험기준으로 잘 알려진 폐 암의 바이오마커를 사용하여 분석한 결과, transcriptome de Bruijn graph 알고리즘 기반의 의사 정렬 도구인 Kallisto가 결과생산의 속도도 빠르고 결과의 정확성에 있어서도 bowtie2 보다 우수하다는 결론을 얻었다. 이러한 결론은 간 암 바이오마커를 적용하여 분석한 결과를 통해서도 입증되었다.
Lung cancer and liver cancer are the top 10 leading causes of cancer death worldwide, and thus it is essential to identify the genes expressed in these two cancer types for the development of new therapeutics. Although many messenger RNA (mRNA) sequencing data related to these cancer tissues are ava...
Lung cancer and liver cancer are the top 10 leading causes of cancer death worldwide, and thus it is essential to identify the genes expressed in these two cancer types for the development of new therapeutics. Although many messenger RNA (mRNA) sequencing data related to these cancer tissues are available due to the advancement of next gen sequencing (NGS) technologies, optimized data processing methods need to be developed to identify the novel cancer-specific genes. In this study, an analytical comparison was carried out between bowtie2, a burrows-wheeler transform-based alignment tool, and Kallisto, which adopts pseudo alignment based on transcriptome de Bruijn graph using mRNA sequencing data about normal cells and lung/liver cancer tissues. mRNA sequencing reads data about lung/liver cancer cells as nucleotide sequences (fasta/fastq file) were extracted and quantified. While Kallisto could directly give the output in Transcripts Per Million (TPM) values, bowtie2 provided the counts. Thus, TPM values were calculated by processing the Sequence Alignment Map (SAM) file in R using package Rsubread and subsequently in python. This difference in TPM/read count outputs from bowtie2 and Kallisto could be due to Kallisto having a bias correction inbuilt acting as quality control. The evaluation of these two data processing methods using the known lung cancer biomarkers leads to the conclusion that in standard settings without any dedicated quality control, Kallisto is more effective at producing faster and more accurate results than bowtie2. Such conclusions were also drawn and confirmed with the known biomarkers specific to liver cancer.
Lung cancer and liver cancer are the top 10 leading causes of cancer death worldwide, and thus it is essential to identify the genes expressed in these two cancer types for the development of new therapeutics. Although many messenger RNA (mRNA) sequencing data related to these cancer tissues are available due to the advancement of next gen sequencing (NGS) technologies, optimized data processing methods need to be developed to identify the novel cancer-specific genes. In this study, an analytical comparison was carried out between bowtie2, a burrows-wheeler transform-based alignment tool, and Kallisto, which adopts pseudo alignment based on transcriptome de Bruijn graph using mRNA sequencing data about normal cells and lung/liver cancer tissues. mRNA sequencing reads data about lung/liver cancer cells as nucleotide sequences (fasta/fastq file) were extracted and quantified. While Kallisto could directly give the output in Transcripts Per Million (TPM) values, bowtie2 provided the counts. Thus, TPM values were calculated by processing the Sequence Alignment Map (SAM) file in R using package Rsubread and subsequently in python. This difference in TPM/read count outputs from bowtie2 and Kallisto could be due to Kallisto having a bias correction inbuilt acting as quality control. The evaluation of these two data processing methods using the known lung cancer biomarkers leads to the conclusion that in standard settings without any dedicated quality control, Kallisto is more effective at producing faster and more accurate results than bowtie2. Such conclusions were also drawn and confirmed with the known biomarkers specific to liver cancer.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.