[논문]순환형 히스토그램 쉬프팅 기반 가역성 DNA 정보은닉 기법

이석환; 권성근; 권기룡

doi:10.5573/ieie.2016.53.12.067

순환형 히스토그램 쉬프팅 기반 가역성 DNA 정보은닉 기법
Reversible DNA Information Hiding based on Circular Histogram Shifting 원문보기

Journal of the Institute of Electronics and Information Engineers = 전자공학회논문지, v.53 no.12 = no.469, 2016년, pp.67 - 75

이석환 (동명대학교 정보보호학과) , 권성근 (경일대학교, 전자공학과) , 권기룡 (부경대학교, IT융합응용공학과)

초록
AI-Helper

DNA 컴퓨팅 기술로 DNA 정보를 매개물로 하는 DNA 저장, DNA 스테가노그라픽, 및 DNA 워터마킹에 대한 관심이 많아지고 있다. 생물학적 변이없이 외부 워터마크를 DNA 정보 내에 은닉에서는 원본 DNA 서열의 복원이 가능하고, 은닉과 복원이 반복적으로 이루어지며, 외부 워터마크에 의한 의도적인 변이 분석이 가능한 가역성 정보은닉 기술이 필요하다. 본 논문에서는 DNA 부호계수의 순환형 히스토그램 다중 쉬프팅 (Circular Histogram Shifting, CHS) 기반으로 생물학적 변이없이 허위개시코돈 방지, 원본 서열 길이 유지, 높은 워터마크 용량성, 블라인드 검출이 가능한 가역성 DNA 정보은닉 방법을 제안한다. 제안한 방법은 비부호 영역 DNA 염기서열을 부호계수로 변환한 다음, 높은 용량성을 위하여 순환형 히스토그램 다중 쉬프팅에 의하여 부호계수에 다중비트를 은닉한다. 마지막으로 다중비트 은닉 과정에서 은닉된 인접 염기서열 간의 비교탐색을 통하여 허위개시코돈 생성을 방지한다. 실험 결과로부터 제안한 방법이 기존 방법보다 0.11~0.50 bpn(bit per nucleotide base) 높은 워터마크 용량성을 가지고, 허위개시코돈이 발생되지 않음을 확인하였다.

Abstract ▼ AI-Helper

DNA computing technology makes the interests on DNA storage and DNA watermarking / steganography that use the DNA information as a newly medium. DNA watermarking that embeds the external watermark into DNA information without the biological mutation needs the reversibility for the perfect recovery of host DNA, the continuous embedding and detecting processing, and the mutation analysis by the watermark. In this paper, we propose a reversible DNA watermarking based on circular histogram shifting of DNA code values with the prevention of false start codon, the preservation of DNA sequence length, and the high watermark capacity, and the blind detection. Our method has the following features. The first is to encode nucleotide bases of 4-character variable to integer code values by code order. It makes the signal processing of DNA sequence easy. The second is to embed the multiple bits of watermark into -order coded value by using circular histogram shifting. The third is to check the possibility of false start codon in the inter or intra code values. Experimental results verified the our method has higher watermark capacity 0.11~0.50 bpn than conventional methods and also the false start codon has not happened in our method.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 논문에서는 DNA 저장, 스테가노그라픽, 및 워터마킹 등의 바이오 정보보호를 위하여 순환형 히스토그램 다중 쉬프팅를 이용한 가역성 DNA 정보은닉 방법을 제안하였다. DNA 정보는 외부 워터마크에 의하여 생물학적 변이를 유발할 수 있으므로, 정보은닉된 DNA 정보로부터 원본 DNA가 오류없이 복원이 되어야 한다.
본 논문에서는 순환형 히스토그램 쉬프팅을 이용한 비부호 DNA 가역 정보은닉 기법을 제안한다. DNA 가역 정보은닉은 그림 1에서와 같이, 워터마크가 은닉되기에 적절한 길이를 가지는 인트론(Intron) 성분으로 구성된 비부호 DNA 영역에 워터마크가 은닉되며, 은닉된 영역들은 추출 및 복원 과정에 의하여 워터마크가 추출되고, 원본 영역으로 복원된다.
본 논문에서는 허위개시코돈 방지 및 높은 용량성을 위한 순환형 히스토그램 다중 쉬프팅 기반 비부호 DNA 서열의 가역 정보은닉 방법들을 제시한다. 제안한 방법에서는 4문자-염기서열을 연속적인 n개 염기 단위(또는 n 부호 차수)의 정수형 부호계수열로 변환한다.

제안 방법

제안한 방법에서는 비부호 영역에 허위개시코돈 발생되지 않도록 가역 워터마크를 은닉하므로 생물학적 기능 변경이 없다. 따라서 본 실험에서는 제안한 순환형 히스토그램 쉬프팅 방법과, Chen 방법^[8], Huang 방법^[9], LS-PE 방법^[12]의 워터마크 용량 bpn, 압축 부가정보량 Extra, 염기 변화율, 및 허위개시코돈 발생 가능성에 대하여 비교 분석하였다. 실험에서 사용된 DNA 서열은 NCBI GenBank에서 제공된 것이며, 이들의 타입, Access No.
본 실험에서는 제안한 방법의 최대 쉬프팅 비트수 kmax를 kmax = 2n- 2 (n∈[2,6])로 설정한 다음, 기존 방법의 워터마크 bpn를 비교 평가하였다.
본 논문에서는 허위개시코돈 방지 및 높은 용량성을 위한 순환형 히스토그램 다중 쉬프팅 기반 비부호 DNA 서열의 가역 정보은닉 방법들을 제시한다. 제안한 방법에서는 4문자-염기서열을 연속적인 n개 염기 단위(또는 n 부호 차수)의 정수형 부호계수열로 변환한다. 이 때, 인접 구간 및 최소 및 최대 영역의 경계 구간 간에 쉬프팅이 되도록 부호계수열을 순환형 히스토그램(Circular Histogram)으로 할당한다.
4-문자 염기 서열에 대한 신호 처리 용이성을 위하여 다중비트 부호 과정이 필수적이다. 제안한 방법에서는 LS-PE 방법^[12]에서 제시된 다중비트 부호 과정에 의하여 DNA 염기 서열을 부호한다.
DNA 정보는 외부 워터마크에 의하여 생물학적 변이를 유발할 수 있으므로, 정보은닉된 DNA 정보로부터 원본 DNA가 오류없이 복원이 되어야 한다. 제안한 방법은 4-문자 염기서열을 부호차수에 의한 정수형 부호계수로 변환한 다음, 순환형 히스토그램 다중 쉬프팅을 이용하여 부호계수별 다중비트를 은닉한다. 일반적인 가역 영상 워터마킹은 영상 화질에 의하여 다중 쉬프팅이 어렵다.
제안한 방법은 워터마크 은닉 과정과 부가 데이터의 LSB 치환 과정에서 허위 개시코돈 방지를 위하여 비교 탐색 과정을 수행한다. 따라서 모든 실험 상에서 제안한 방법이 허위 개시코돈이 발생되지 않음을 확인하였다.

성능/효과

Chen의 방법은 104 염기 당 하나의 허위 개시코돈이 발생되며, Huang의 방법은 5.78×105 염기 당 하나의 허위 개시코돈이 발생됨을 확인하였다.
제안한 방법은 워터마크 은닉 과정과 부가 데이터의 LSB 치환 과정에서 허위 개시코돈 방지를 위하여 비교 탐색 과정을 수행한다. 따라서 모든 실험 상에서 제안한 방법이 허위 개시코돈이 발생되지 않음을 확인하였다. 그러나 기존의 Chen 방법과 Huang 방법은 허위 개시코돈 발생에 대하여 고려하지 않으며, 실험의 워터마크 은닉 과정에서 허위 개시코돈이 발생되었다.
30 정도의 부가정보량 필요하다. 따라서 제안한 방법이 다른 방법에 비하여 가장 높은 워터마크 bpn를 가지는 것에 비하여 0.3 정도의 낮은 부가정보량이 필요함을 알 수 있었다.
5 bpn 정도 높음을 확인하였다. 또한 기존 Chen 방법^[8]과 Huang 방법^[9]은 허이개시코돈이 발생되었으나, 제안한 방법과 LS-PE 방법^[12]에서는 허위개시코돈이 발생되지 않음을 확인하였다.
그러나 비부호 DNA 서열은/ 정크 DNA으로 가정할 때, 염기 변화율이 높더라도 부호 DNA 서열에 영향을 미치지 않는다. 또한 제안한 방법들은 부호 DNA 서열의 시작 코돈으로 변경되지 않으므로, 아미노산 서열에 전혀 영향을 미치지 않는다. 즉, 데이터 은닉된 서열 Γ′(n)을 가지는 비부호 DNA 서열은 D′^nc = Γ′(n) + Γ^C(n)와 같으며, 은닉된 DNA 서열은 D′ = D′^nc+ D^c 와 같다.
세 번째로는 DNA 서열의 길이가 변경되지 않으면서, 참조 서열 또는 원본 서열이 없이 워터마크 추출 또는 DNA 서열 복원이 가능하여야 한다. 워터마크 정보를 담은 염기 서열들이 비부호 DNA 서열의 정크 영역에 추가 및 추출될 수 있다.
그러나 DNA 염기서열은 영상 화질과 같은 가시성 기준이 없는 반면, 생물학적 변이 유지 및 허위개시코돈 방지 등의 제한 조건 하에서 DNA 부호계수의 변경이 자유롭다. 실험 결과로부터 제안한 방법은 기존의 LS-PE 방법, Chen 방법, Huang 방법보다 약 0.11~0.50 bpn 정도의 워터마크 bpn이 높았으며, 허위개시코돈이 발생되지 않음을 확인하였다.
그리고 워터마크 메시지의 다중비트 단위로 히스토그램 쉬프팅을 수행한 후, 워터마크된 염기서열 내에 인접 염기서열 간의 비교 탐색을 통하여 개시코돈 생성을 방지한다. 실험 결과로부터 제안한 방법의 워터마크 용량이 LS-PE 방법^[12]보다 0.120~0.194 bpn 정도 높고, Chen 방법^[8]과 Huang 방법^[9]보다 0.5 bpn 정도 높음을 확인하였다. 또한 기존 Chen 방법^[8]과 Huang 방법^[9]은 허이개시코돈이 발생되었으나, 제안한 방법과 LS-PE 방법^[12]에서는 허위개시코돈이 발생되지 않음을 확인하였다.
일반적으로 인접 화소 간의 유사성이 많은 영상데이터와는 달리 염기서열에서는 인접 부호계수 간의 유사성이 크지 않으므로, 선형 예측 기반 차분 확장 방법보다 히스토그램 쉬프팅 방법이 보다 많은 용량을 가진다. 이상의 기존 방법들은 원본 서열 길이를 유지하나, 허위개시코돈 방지를 고려하지 않고, 비블라인드이거나, 낮은 용량을 가진다.
78×10⁵ 염기 당 하나의 허위 개시코돈이 발생됨을 확인하였다. 제안한 DE, HS, 및 CHS 방법 모두 허위 개시코돈이 발생되지 않았다
영상 가역 워터마킹의 성능 평가에서는 용량(bpp; bit per pixel)에 대한 PSNR이 사용되나, DNA 가역 정보은닉에서는 PSNR의 화질 척도 대신 생물학적 기능 변경이 사용된다. 제안한 방법에서는 비부호 영역에 허위개시코돈 발생되지 않도록 가역 워터마크를 은닉하므로 생물학적 기능 변경이 없다. 따라서 본 실험에서는 제안한 순환형 히스토그램 쉬프팅 방법과, Chen 방법^[8], Huang 방법^[9], LS-PE 방법^[12]의 워터마크 용량 bpn, 압축 부가정보량 Extra, 염기 변화율, 및 허위개시코돈 발생 가능성에 대하여 비교 분석하였다.
그림 3은 염기변화율에 대한 워터마크 bpn를 나타낸다. 제안한 방법은 0.7~0.8의 염기변화율을 가지면서, 0.32~0.58의 워터마크 bpn를 가진다. LS-PE 방법은 0.
42의 다소 낮은 워터마크 bpn를 가진다. 즉, 제안한 방법은 기존 LS-PE 방법에 비하여 0.14~0.16 높은 워터마크 bpn를 가지나, 0.28~0.38 정도 높은 염기변화율을 가진다. 그러나 비부호 DNA 서열은/ 정크 DNA으로 가정할 때, 염기 변화율이 높더라도 부호 DNA 서열에 영향을 미치지 않는다.

질의응답

핵심어	질문	논문에서 추출한 답변
	가역 DNA 정보은닉의 역할은?	가역 DNA 정보은닉은 DNA 저장, DNA 서열의 위변조 방지 뿐만 아니라 외부 워터마크에 의한 생물학적 변이를 방지하는 한편, 은닉과 복원의 반복적 과정을 통하여 워터마크에 의한 생물학적 변이 과정 분석이 가능하다. 그러나 가역 DNA 정보은닉은 일반 멀티미디어 데이터와는 달리 네 개의 문자로 구성된 염기 서열의 낮은 신호량으로 인하여 비가역 DNA 정보은닉에 비하여 연구가 많이 진행되고 있지 않다.
	DNA 저장 및 워터마킹에서는 어떠한 기술이 필요한가?	최근 DNA 컴퓨팅 기술로 인하여 DNA를 매개물로 하는 DNA 저장[1～2] 및 비밀 통신, 암호화 및 저작권 보호를 위한 DNA 워터마킹[3～7]에 대하여 많은 연구가 이루어지고 있다. DNA 저장 및 워터마킹에서는 원본 DNA 서열의 손실없이 복구할 수 있는 가역성 기술이 매우 필요하다. 대부분의 DNA 워터마킹 방법[3～7]들은 원본 복구 기능이 없는 비가역에 해당된다.
	LS-PE 방법의 문제점은 무엇인가?	4 bpn를 가지며, 인접 염기서열 간의 비교탐색을 통하여 허위개시코돈 생성을 방지한다. 그러나 워터마크 추출에 필요한 부가데이터 정보가 1.11 bpn 정도 필요하며, 인접 계수 쌍에 대한 차이 확장으로 고용량 데이터 은닉에는 적합하지 않다. 따라서 낮은 부가데이터와 높은 워터마크 용량을 가지는 가역성 DNA 정보은닉 방법이 필요하다.

참고문헌 (13)

G. M. Church, Y. Gao, S. Kosuri, "Nextgeneration digital information storage in DNA," Science, Vol. 337, No. 6102, pp. 1628, Sep. 2012.

상세보기
N. Goldman, P. Bertone, S. Chen, C. Dessimoz, E. M. LeProust, B. Sipos, and E. Birney, "Towards practical high-capacity, low-maintenance information storage in synthesized DNA, " Nature, Vol. 494, pp. 77-80, Feb. 2013.

상세보기
D. Heider and A. Barnekow, "DNA-based watermarks using the DNA-Crypt algorithm," BMC Bioinformatics, Vol. 8, No. 176, May 2007.
M. Liss, D. Daubert, K. Brunner, K. Kliche, U. Hammes, A. Leiherer, and R. Wagner, "Embedding permanent watermarks in synthetic genes," PLOS ONE, Vol. 7, Issue 8, e42465, Aug. 2012.

상세보기
S. H. Lee, "DWT based coding DNA watermarking for DNA copyright protection, " Information Sciences, Vol. 273, pp. 263-286, July, 2014.

상세보기
S. H. Lee, "DNA sequence watermarking based on random circular angle, " Digital Signal Processing, Vol. 25, pp. 173-189, Feb. 2014.

상세보기
S.-H. Lee, K.-R. Kwon, and S.-G. Kwon, "A Robust DNA Watermarking in Lifting Based 1D DWT Domain, " Journal of the Institute of Electronics and Information Engineers, Vol. 49, No. 10, pp. 91-101, Oct. 2015.
T. Chen, "A novel biology-based reversible data hiding fusion scheme," Frontiers in Algorithmics, Lecture Notes in Computer Science, Vol. 4613, pp 84-95, 2007.
Y.-H. Huang, C.-C. Chang, and C.-Y. Wu, "A DNA-based data hiding technique with low modification rates," Multimedia Tools and Applications, Volume 70, Issue 3, pp 1439-1451, June 2014.

상세보기
G. Liu, H. Liu, and A. Kadir, "Hiding message into DNA sequence through DNA coding and chaotic map," Medical & Biological Engineering & Computing, vol. 52, issue 9, pp. 741-747, Sep. 2014.

상세보기
S.-H. Lee and K.-R. Kwon, "Consecutive difference expansion based reversible dna watermarking," Journal of the Institute of Electronics and Information Engineers, Vol. 52, No. 7, pp. 51-62, July 2015.
S.-H. Lee, S.-G. Kwon, and K.-R. Kwon, "Least Square Prediction Error Expansion Based Reversible Watermarking for DNA Sequence, " Journal of the Institute of Electronics and Information Engineers, Vol. 52, No. 11, pp. 66-78, Nov. 2015.
D. M. Thodi et al. "Expansion embedding techniques for reversible watermarking, " IEEE Trans. on Image Processing, Vol. 16, No. 3, March 2007.

저자의 다른 논문 :

LOADING...

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증