수술 동영상의 비식별화를 위한 개인식별정보 자동 검출 시스템 설계 및 구현 Design and Implementation of Automated Detection System of Personal Identification Information for Surgical Video De-Identification원문보기
최근 의료정보기술 분야에서 비디오는 풍부한 임상정보를 포함하는 특징으로 인하여 새로운 서비스 창출 및 연구개발을 위한 중요한 데이터로서 그 가치를 새롭게 평가받고 있다. 그러나 임상정보는 개인정보를 포함하고 있어, 생명윤리 혹은 연구 윤리에 대한 고려가 필요하다. 따라서 비디오 또한 의료영상으로서 비식별화가 요구되지만 기존 방법은 주로 정형데이터와 정지영상에 특화되어 기존의 방법을 그대로 적용하기 어려운 문제가 있다. 본 논문에서는 개인정보 비식별화 처리 시스템과의 연동을 고려하여 비디오 내에서 개인식별정보를 검출하는 자동화 시스템을 제안한다. 제안 시스템은 장면분할과 체내외 영역 검출의 전처리 후에 텍스트 및 사람검출을 통한 인덱싱과정을 수행한다. 검출된 개인식별 인덱스 정보는 비식별화를 수행하는 외부 시스템 및 시각화를 위한 메타데이터로 제공된다. 제안 시스템의 효용성을 검증하기 위하여 프로토타입을 구현하고 실제 수술비디오를 대상으로 인덱싱 속도를 측정하였다. 그 결과 입력 비디오의 재생시간 대비 2배 이상의 빠른 작업속도를 보였으며, 수술교육콘텐츠 제작 및 학술용 반자동 편집시스템의 사례를 통해 빠른 의사결정을 보조할 수 있음을 확인하였다.
최근 의료정보기술 분야에서 비디오는 풍부한 임상정보를 포함하는 특징으로 인하여 새로운 서비스 창출 및 연구개발을 위한 중요한 데이터로서 그 가치를 새롭게 평가받고 있다. 그러나 임상정보는 개인정보를 포함하고 있어, 생명윤리 혹은 연구 윤리에 대한 고려가 필요하다. 따라서 비디오 또한 의료영상으로서 비식별화가 요구되지만 기존 방법은 주로 정형데이터와 정지영상에 특화되어 기존의 방법을 그대로 적용하기 어려운 문제가 있다. 본 논문에서는 개인정보 비식별화 처리 시스템과의 연동을 고려하여 비디오 내에서 개인식별정보를 검출하는 자동화 시스템을 제안한다. 제안 시스템은 장면분할과 체내외 영역 검출의 전처리 후에 텍스트 및 사람검출을 통한 인덱싱과정을 수행한다. 검출된 개인식별 인덱스 정보는 비식별화를 수행하는 외부 시스템 및 시각화를 위한 메타데이터로 제공된다. 제안 시스템의 효용성을 검증하기 위하여 프로토타입을 구현하고 실제 수술비디오를 대상으로 인덱싱 속도를 측정하였다. 그 결과 입력 비디오의 재생시간 대비 2배 이상의 빠른 작업속도를 보였으며, 수술교육콘텐츠 제작 및 학술용 반자동 편집시스템의 사례를 통해 빠른 의사결정을 보조할 수 있음을 확인하였다.
Recently, the value of video as an important data of medical information technology is increasing due to the feature of rich clinical information. On the other hand, video is also required to be de-identified as a medical image, but the existing methods are mainly specialized in the stereotyped data...
Recently, the value of video as an important data of medical information technology is increasing due to the feature of rich clinical information. On the other hand, video is also required to be de-identified as a medical image, but the existing methods are mainly specialized in the stereotyped data and still images, which makes it difficult to apply the existing methods to the video data. In this paper, we propose an automated system to index candidate elements of personal identification information on a frame basis to solve this problem. The proposed system performs indexing process using text and person detection after preprocessing by scene segmentation and color knowledge based method. The generated index information is provided as metadata according to the purpose of use. In order to verify the effectiveness of the proposed system, the indexing speed was measured using prototype implementation and real surgical video. As a result, the work speed was more than twice as fast as the playing time of the input video, and it was confirmed that the decision making was possible through the case of the production of surgical education contents.
Recently, the value of video as an important data of medical information technology is increasing due to the feature of rich clinical information. On the other hand, video is also required to be de-identified as a medical image, but the existing methods are mainly specialized in the stereotyped data and still images, which makes it difficult to apply the existing methods to the video data. In this paper, we propose an automated system to index candidate elements of personal identification information on a frame basis to solve this problem. The proposed system performs indexing process using text and person detection after preprocessing by scene segmentation and color knowledge based method. The generated index information is provided as metadata according to the purpose of use. In order to verify the effectiveness of the proposed system, the indexing speed was measured using prototype implementation and real surgical video. As a result, the work speed was more than twice as fast as the playing time of the input video, and it was confirmed that the decision making was possible through the case of the production of surgical education contents.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 수술 과정 등에서 생산된 비디오에 대한 객체화를 통해 프레임 단위의 메타데이터 생성이 가능함을 확인하기 위해 텍스트와 인물에 대한 검출을 시도하였다. (그림 5)는 의료 비디오에서 나타나는 개인식별정보 사례로서 환자진료정보 등의 텍스트와 인물이 포함된 예를 보여준다.
본 논문에서는 제안 시스템의 기능 확장이 용이한 구조를 설계하고 이를 통해 다양한 개인식별정보 후보를 검출할 수 있는 알고리즘 및 외부 시스템의 효과적인 연동 및 확장이 가능하도록 하였다. (그림 2)는 이러한 설계 목표를 반영한 제안 시스템의 표준 플러그인 API 기반의 처리구조를 나타낸다.
본 논문은 내시경을 이용한 진단 또는 복강경 등의 수술 과정에서 생산된 비디오를 이용함에 있어 개인식별정보에 대한 비식별화 과정에서 반드시 필요한 프레임단위의 개인식별정보 후보에 대한 검출을 통한 인덱싱 자동화 및 메타데이터 관리 체계를 제안하였다. 기존의 의료영상을 위한 비식별화 방법은 주로 정지영상의 처리에 집중하였으므로 비디오에 직접 적용하기 어려운 문제가 있었다.
본 논문은 의료정보기술의 연구개발에 있어 풍부한 임상정보를 포함하는 대량의 수술 비디오 데이터를 적시에 활용이 가능하도록 개인정보 비식별화 작업에 필요한 빠르고 유효한 의사결정을 보조하는 시스템에 관심을 갖는다. 이를 위해 대용량 및 대량의 비디오 프레임에 대한 효과적인 비식별화 요소의 검수 자동화 체계를 제안한다.
가설 설정
그런데 의료진의 경우에는 항상 마스크 등을 착용하고 있으며, 환자의 경우 호흡기 등으로 인해 랜드마크 등의 특징점을 이용하는 대부분의 얼굴검출 알고리즘은 적용이 어렵다. 따라서 비디오 내에 등장하는 인물은 최소한 두부와 상반신의 일부가 나타남을 가정하고 딥러닝 기반의 YOLO 모델[21]을 이용하여 검출을 시도하였다. 텍스트 검출과 마찬가지로 표준 플러그인 API를 이용하여 제안 시스템과 연동하였다.
제안 방법
(그림 6)은 표준 플러그인 API를 이용하여 Tesseract 엔진을 플러그인화 하고 이를 제안 시스템과 연동하는 구조를 나타낸다. Tesseract는 입력으로 디코딩된 프레임의 버퍼가 아닌 이미지 파일을 요구하므로, 플러그인으로 전달된 프레임 버퍼에 대하여 TIFF 형식의 이미지 파일로 저장 후 이를 Tesseract 엔진으로 전달하는 방법을 적용하였다.
제안 시스템의 설계에 대한 구현 가능성 및 운용에 따른 효용을 검증하기 위하여 본문에 설명한 기능을 충족하는 프로토타입을 구현하였다. 그 후 비디오 인덱싱을 위한 육안 검사에 의한 방식 대비 작업소요시간 측면에서의 개선 여부 및 실무효용성에 대한 검증을 실시하였으며 그 결과와 함께 제안 시스템의 인덱싱 기능을 활용한 응용 사례를 제시하였다. 검증을 위한 실험에 이용한 시스템은 OS는 Windows 10을, 하드웨어는 Intel i9-7900X @ 3.
끝으로 비식별화 관련 작업에 대한 제안 시스템의 실무효용성에 대한 검증을 실시하였다. 특히 작업 속도 측면에서 육안 검사에 의한 방법을 대체 가능한 수준인가를 판단할 필요가 있었다.
특히 데이터 이용 목적과 접근 권한, 처리 기준에 따라 비식별화 또는 익명화 등 처리방식을 달리해야 하는 요구를 고려할 때 비디오에 대하여 데이터 요청이 발생할 때마다 식별정보를 검출하고 요구되는 처리를 반복적으로 수행하는 것은 많은 처리비용을 필요로 하므로 비효율적이다. 따라서 비식별화 처리의 전처리 과정으로서 비디오의 각 프레임으로부터 개인식별정보 후보 요소에 대하여 인덱싱하고 이를 메타데이터로 관리하는 과정이 필요하며, 제안 시스템은 이에 대한 구조화 방안에 대하여 제안 한다.
이 경우 영상에 포착된 인물은 비식별화가 필요할 수 있다. 따라서 제안 시스템은 인물의 등장 여부를 탐지하고 이를 인덱싱하여 비식별화 처리 시스템 또는 작업자에게 제공 가능한 메타데이터로 구성한다. 그런데, 의도적으로 가공하지 않은 원시 비디오의 경우 (그림 4)와 같이 체내에서 인물의 얼굴이 나타날 가능성은 현저히 낮다.
(그림 7)은 제안된 구조를 적용한 서버 구조를 나타낸다. 비디오와 메타데이터의 아카이빙을 위한 스토리지 서버, 제안된 개인식별정보 후보를 검출하고 이를 인덱싱하는 분석 서버, 입력된 원시 비디오에 대한 트랜스코딩 및 웹 UI를 통한 미리보기를 위한 스트리밍 서버, 그리고 서비스 관리 및 콘텐츠 조회를 위한 웹 서비스를 제공하는 WAS로 구성된다.
둘째, 연구자에 대한 비디오 검색 시스템을 제공한다. 셋째, 개인식별정보 후보를 빠르게 검출하고 인덱싱하기 위하여 전체 프레임이 아닌 유의미한 최소 단위 검사를 수행한다. 이는 비디오 프레임을 Shot과 Scene의 논리적 계층구조로 분할하는 장면분할 후 이를 비디오의 구조정보로 이용함으로써 구현할 수 있다.
둘째, 검출된 정보를 바탕으로 프레임 단위의 인덱싱 및 카탈로깅 정보를 생성하며, 외부의 비식별화 처리 시스템과의 연동을 위해 이를 메타데이터로 변환은 물론 분석 정보에 대한 시각화 기능을 제공한다. 셋째, 제안 시스템은 의료 현장의 새로운 요구사항을 반영하여 효과적으로 기능의 추가 및 확장이 가능한 표준 플러그인 API 기반의 기능 실행 구조를 설계하였다. 또, 제안 시스템은 실험을 통해 입력 비디오에 대한 평균 2.
본 논문은 의료정보기술의 연구개발에 있어 풍부한 임상정보를 포함하는 대량의 수술 비디오 데이터를 적시에 활용이 가능하도록 개인정보 비식별화 작업에 필요한 빠르고 유효한 의사결정을 보조하는 시스템에 관심을 갖는다. 이를 위해 대용량 및 대량의 비디오 프레임에 대한 효과적인 비식별화 요소의 검수 자동화 체계를 제안한다. 즉, 비디오에 그래픽 형태로 포함된 텍스트 기반의 의료 정보를 비롯하여 환자 및 의료진의 얼굴 및 신체 등 시각적으로 환자의 신원을 직, 간접적으로 파악할 수 있는 요소를 검출하고 이를 인덱싱하여 비디오 카탈로깅 형태로 제공한다.
한편 인물의 얼굴이 노출되는 경우는 앞서 살펴본 두부 CT 영상을 비롯하여 다양한 사례가 있겠으나 본 논문에서는 복강경 수술에 대하여 수술 도구에 장착된 카메라가 체외에 노출된 상태에서 환자 또는 의료진의 모습을 포착한 경우 이를 탐지하도록 하였다. 이를 위해 전처리 과정에서 체내 장면으로 인식된 프레임에 대하여 사람 검출을 시도하였다. 사람을 검출하는 방법에는 얼굴을 검출하는 방법과 신체를 검출하는 방법이 있다.
따라서 개인식별정보 후보를 검출하는 알고리즘의 목적 또는 특성에 따라 현재 프레임이 체내 또는 체외인 경우에 한정적으로 동작하도록 하여 처리 효율성을 높이는 전략을 취할 필요가 있다. 이를 위해 제안 시스템은 HSI 컬러모델의 지식기반 검출 방법을 수행한다.
암전 효과가 적용된 도입부는 흰색 바탕에 의사의 상반신 프로필 사진이 포함되어 있으며, 콘텐츠에는 의료진이 노출된 장면이 포함되어 있다. 이와 같이 제안 시스템은 비식별화가 필요할 것으로 예상되는 시각요소를 자동으로 검출하고 인덱싱함은 물론 카탈로그 형태로 시각화하여 제공한다. 예시는 제안 시스템의 분석결과를 카탈로깅하기 위한 리포트 인터페이스를 통해 확인한 체내 및 체외 검출 결과를 나타낸다.
정지영상과 달리 비디오는 적게는 수십 분 분량의 연속된 프레임으로 구성되고, 이러한 원시 비디오를 사용자 요구에 따라 적시에 비식별화하여 제공 가능해야 함을 고려할 필요가 있다. 이와 관련하여 공개된 의료용 비디오 데이터셋인 m2cai16-tool 데이터셋[22]에 대하여 인물과 텍스트를 임의로 조합한 비디오 10건을 순차 입력하여 평균 소요시간을 산출하였다. 이때 소요시간은 각 입력의 첫 프레임으로부터 마지막 프레임의 처리가 완료될 때까지의 소요된 시간을 초단위로 측정하였으며, 처리 속도는 비디오의 길이, 즉 입력된 원시 비디오의 재생 시간을 제안 방법에 의한 처리소요시간으로 나눈 배속으로 나타내었으며 1보다 클수록 입력의 재생시간보다 빠르게 처리를 완료하였다고 판단할 수 있다.
(그림 9)는 사람을 검출하여 인덱싱한 결과이다. 입력 비디오는 술기 시연을 목적으로 제작된 비디오 콘텐츠를 이용하였다. 암전 효과가 적용된 도입부는 흰색 바탕에 의사의 상반신 프로필 사진이 포함되어 있으며, 콘텐츠에는 의료진이 노출된 장면이 포함되어 있다.
제안 시스템은 개인식별정보 후보에 대한 검출에 앞서 장면분할과 컬러 지식기반 모델을 이용하는 전처리과정을 거친다. 이를 통해 장면분할 정보와 체내 및 체외 구분 정보를 생성한다.
전처리과정은 입력된 비디오의 디코딩된 각 프레임에 대하여 적용되며, 그 결과는 병렬로 수행되는 객체화 과정에 동시에 입력된다. 제안 시스템은 비디오에 대한 비식별화를 위한 기초정보를 제공하는 목적 외에 세 가지 측면의 설계 목표를 갖는다. 첫째, 작업자의 업무 효율을 제고하기 위하여 분석 결과에 대한 검토용 정보를 제공한다.
따라서 OCR 등의 방법으로 인식된 텍스트의 모든 형식에 대하여 정규표현식을 적용하기란 어려운 문제이다. 제안 시스템은 오픈소스 OCR 프로젝트인 Tesseract[20]를 이용하여 텍스트를 검출하고 일정 길이 이상의 문자가 탐지된 경우에 한하여 유의미한 텍스트가 포함된 것으로 간주하였다. (그림 6)은 표준 플러그인 API를 이용하여 Tesseract 엔진을 플러그인화 하고 이를 제안 시스템과 연동하는 구조를 나타낸다.
제안 시스템의 설계에 대한 구현 가능성 및 운용에 따른 효용을 검증하기 위하여 본문에 설명한 기능을 충족하는 프로토타입을 구현하였다. 그 후 비디오 인덱싱을 위한 육안 검사에 의한 방식 대비 작업소요시간 측면에서의 개선 여부 및 실무효용성에 대한 검증을 실시하였으며 그 결과와 함께 제안 시스템의 인덱싱 기능을 활용한 응용 사례를 제시하였다.
(그림 1)은 기존의 비식별화 및 배포 체계에 대하여 수술 비디오에 대한 제안된 비디오 분석 시스템을 결합한 운용체계를 나타낸다. 제안 시스템이 담당하는 분석작업은 개인식별정보 후보에 대한 시각요소를 검출하는 비디오 객체화를 수행하고 검출된 요소에 대하여 발생정보, 즉 개인식별정보 후보의 ID, 프레임 번호와 타임코드 등을 작업번호와 함께 기록하는 인덱스 정보를 생성한다. 이를 통해 최종적으로 생성된 정보를 메타데이터로 구성하고 이를 비디오와 함께 스토리지에 아카이빙한다.
이를 위해 대용량 및 대량의 비디오 프레임에 대한 효과적인 비식별화 요소의 검수 자동화 체계를 제안한다. 즉, 비디오에 그래픽 형태로 포함된 텍스트 기반의 의료 정보를 비롯하여 환자 및 의료진의 얼굴 및 신체 등 시각적으로 환자의 신원을 직, 간접적으로 파악할 수 있는 요소를 검출하고 이를 인덱싱하여 비디오 카탈로깅 형태로 제공한다. 이를 통해 검사 인력은 용도 및 취급기준에 따라 비식별화가 필요한 요소를 포함하는 프레임을 빠르게 확인하고 필요한 조치를 위한 의사결정을 수행할 수 있다.
제안 시스템은 비디오에 대한 비식별화를 위한 기초정보를 제공하는 목적 외에 세 가지 측면의 설계 목표를 갖는다. 첫째, 작업자의 업무 효율을 제고하기 위하여 분석 결과에 대한 검토용 정보를 제공한다. 둘째, 연구자에 대한 비디오 검색 시스템을 제공한다.
제안 시스템은 대용량 및 대량의 비디오를 자동화 처리함에 있어 다음과 같은 특징을 갖는다. 첫째, 텍스트를 비롯하여 환자 및 의료진의 얼굴 및 신체 등 신원을 직, 간접적으로 파악할 수 있는 시각요소를 프레임 단위로 검출한다. 둘째, 검출된 정보를 바탕으로 프레임 단위의 인덱싱 및 카탈로깅 정보를 생성하며, 외부의 비식별화 처리 시스템과의 연동을 위해 이를 메타데이터로 변환은 물론 분석 정보에 대한 시각화 기능을 제공한다.
따라서 비디오 내에 등장하는 인물은 최소한 두부와 상반신의 일부가 나타남을 가정하고 딥러닝 기반의 YOLO 모델[21]을 이용하여 검출을 시도하였다. 텍스트 검출과 마찬가지로 표준 플러그인 API를 이용하여 제안 시스템과 연동하였다. YOLO 모델의 경우 특히 다른 모델에 비하여 비슷한 검출 성능을 나타내면서도 빠른 처리속도를 보여주어 대량의 비디오 프레임을 처리하기에 적합한 것으로 판단하였다.
한편 인물의 얼굴이 노출되는 경우는 앞서 살펴본 두부 CT 영상을 비롯하여 다양한 사례가 있겠으나 본 논문에서는 복강경 수술에 대하여 수술 도구에 장착된 카메라가 체외에 노출된 상태에서 환자 또는 의료진의 모습을 포착한 경우 이를 탐지하도록 하였다. 이를 위해 전처리 과정에서 체내 장면으로 인식된 프레임에 대하여 사람 검출을 시도하였다.
이론/모형
한편, 보건의료분야는 행정, 안전, 금융 등 다른 분야와 마찬가지로 개인정보의 취급과 보호가 매우 중요하다[1,2]. 의과학연구에서의 개인정보와 비식별화에 대한 기준은 개인정보관련 생명윤리법과 IRB 운영지침[3,4], 개인정보 비식별 조치 가이드라인[5]을 참고한다. 또한, 미국 HIPAA 프라이버시 규칙[6]은 주민등록번호, 이름, 주소, 생일 등 통상적인 개인정보를 비롯하여 의료기록번호는 물론 정지사진, 동영상, CCTV 영상, 그리고 신체 식별정보로서 지문, 음성, 홍채 등을 제시하고 있다.
이는 비디오 프레임을 Shot과 Scene의 논리적 계층구조로 분할하는 장면분할 후 이를 비디오의 구조정보로 이용함으로써 구현할 수 있다. 장면 분할을 위한 다양한 방법이 소개되고 있으나, 제안 시스템은 상대적으로 빠르고 안정적인 장면 경계를 분할을 위해 가중치에 따라 RGB 각 채널로부터 선택된 6비트 컬러 정보와 Kirsch 에지 반응에 따라 최댓값과 두 번째, 세 번째 반응 값의 인덱스로 구성된 6비트의 지역 방향 패턴을 결합한 CeLDP[19]방법을 이용한다. CeLDP를 이용한 방법은 각 프레임으로부터 4096개의 특징을 표현하는 히스토그램을 구하여 인접 프레임간 거리 차이를 구하고 임계값에 따라 장면 경계를 결정한다.
성능/효과
따라서 제안 시스템은 자동화를 통해 비디오에 포함된 개인식별정보로서 비식별화 대상 후보로 평가되는 시각 요소에 대한 인덱싱을 매우 효과적으로 빠르게 수행할 수 있음을 확인하였다. 결과적으로 제안 시스템은 자동화를 통해 비디오 인덱싱을 빠르게 처리하면서도 비식별화 처리를 위한 외부 시스템은 물론 시각화 시스템과의 자연스러운 연동을 통해 빠른 의사결정을 보조할 수 있었다. 이를 바탕으로 기존 정지영상에 국한된 의료 영상의 비식별화 체계를 개선할 수 있음을 확인하였으며, 의료현장에서 필요로 하는 풍부한 임상정보를 포함하는 대량의 수술 비디오 데이터에 대한 적시 활용이 가능하도록 지원하여 의료정보기술 발전에 기여할 수 있을 것으로 기대한다.
육안 검사의 경우 전체 프레임을 직접 확인해야 하므로 비디오의 녹화된 시간 또는 재생 시간 이상의 작업시간을 요함을 가정할 수 있으며, 이 경우 1배속 이하의 작업 속도로 나타난다. 따라서 제안 시스템은 자동화를 통해 비디오에 포함된 개인식별정보로서 비식별화 대상 후보로 평가되는 시각 요소에 대한 인덱싱을 매우 효과적으로 빠르게 수행할 수 있음을 확인하였다. 결과적으로 제안 시스템은 자동화를 통해 비디오 인덱싱을 빠르게 처리하면서도 비식별화 처리를 위한 외부 시스템은 물론 시각화 시스템과의 자연스러운 연동을 통해 빠른 의사결정을 보조할 수 있었다.
셋째, 제안 시스템은 의료 현장의 새로운 요구사항을 반영하여 효과적으로 기능의 추가 및 확장이 가능한 표준 플러그인 API 기반의 기능 실행 구조를 설계하였다. 또, 제안 시스템은 실험을 통해 입력 비디오에 대한 평균 2.18배속의 빠른 처리가 가능하여 육안 검사에 검사에 따른 소요시간을 효과적으로 개선함을 확인하였다. 결과적으로 제안 시스템은 기존 정지영상에 국한된 의료영상의 비식별화 체계를 개선하고 의료현장에서 필요로 하는 풍부한 임상정보를 포함하는 대량의 수술 비디오 데이터를 적시에 활용이 가능하도록 지원하는데 기여할 수 있을 것으로 기대한다.
이와 관련하여 공개된 의료용 비디오 데이터셋인 m2cai16-tool 데이터셋[22]에 대하여 인물과 텍스트를 임의로 조합한 비디오 10건을 순차 입력하여 평균 소요시간을 산출하였다. 이때 소요시간은 각 입력의 첫 프레임으로부터 마지막 프레임의 처리가 완료될 때까지의 소요된 시간을 초단위로 측정하였으며, 처리 속도는 비디오의 길이, 즉 입력된 원시 비디오의 재생 시간을 제안 방법에 의한 처리소요시간으로 나눈 배속으로 나타내었으며 1보다 클수록 입력의 재생시간보다 빠르게 처리를 완료하였다고 판단할 수 있다.
후속연구
18배속의 빠른 처리가 가능하여 육안 검사에 검사에 따른 소요시간을 효과적으로 개선함을 확인하였다. 결과적으로 제안 시스템은 기존 정지영상에 국한된 의료영상의 비식별화 체계를 개선하고 의료현장에서 필요로 하는 풍부한 임상정보를 포함하는 대량의 수술 비디오 데이터를 적시에 활용이 가능하도록 지원하는데 기여할 수 있을 것으로 기대한다.
결과적으로 제안 시스템은 자동화를 통해 비디오 인덱싱을 빠르게 처리하면서도 비식별화 처리를 위한 외부 시스템은 물론 시각화 시스템과의 자연스러운 연동을 통해 빠른 의사결정을 보조할 수 있었다. 이를 바탕으로 기존 정지영상에 국한된 의료 영상의 비식별화 체계를 개선할 수 있음을 확인하였으며, 의료현장에서 필요로 하는 풍부한 임상정보를 포함하는 대량의 수술 비디오 데이터에 대한 적시 활용이 가능하도록 지원하여 의료정보기술 발전에 기여할 수 있을 것으로 기대한다.
이를 통해 검사 인력은 용도 및 취급기준에 따라 비식별화가 필요한 요소를 포함하는 프레임을 빠르게 확인하고 필요한 조치를 위한 의사결정을 수행할 수 있다. 이를 통해 기존 정지영상에 국한된 의료영상의 비식별화 체계를 개선하고 의료현장에서 필요로 하는 비디오를 활용한 데이터 연구를 지원하는데 기여한다.
한편 우측은 완벽한 오검출 사례로 영상에 포함된 노이즈에 대하여 텍스트로 오인식한 결과이다. 이에 대한 성능 개선은 후속 연구를 통해 진행예정이다.
질의응답
핵심어
질문
논문에서 추출한 답변
사람을 검출하는 방법에는 무엇이 있는가?
이를 위해 전처리 과정에서 체내 장면으로 인식된 프레임에 대하여 사람 검출을 시도하였다. 사람을 검출하는 방법에는 얼굴을 검출하는 방법과 신체를 검출하는 방법이 있다. 그런데 의료진의 경우에는 항상 마스크 등을 착용하고 있으며, 환자의 경우 호흡기 등으로 인해 랜드마크 등의 특징점을 이용하는 대부분의 얼굴검출 알고리즘은 적용이 어렵다.
의과학연구에서의 개인정보와 비식별화에 대한 기준은 무엇을 참고하는가?
한편, 보건의료분야는 행정, 안전, 금융 등 다른 분야와 마찬가지로 개인정보의 취급과 보호가 매우 중요하다[1,2]. 의과학연구에서의 개인정보와 비식별화에 대한 기준은 개인정보관련 생명윤리법과 IRB 운영지침[3,4], 개인정보 비식별 조치 가이드라인[5]을 참고한다. 또한, 미국 HIPAA 프라이버시 규칙[6]은 주민등록번호, 이름, 주소, 생일 등 통상적인 개인정보를 비롯하여 의료기록번호는 물론 정지사진, 동영상, CCTV 영상, 그리고 신체 식별정보로서 지문, 음성, 홍채 등을 제시하고 있다.
의료영상에 대한 비식별화를 위한 방법 중 의료영상의 헤더에 기록된 식별 정보에 대한 비식별화 또는 익명화 처리 및 배포 방법의 문제점은 무엇인가?
의료영상에 대한 비식별화를 위한 대표적인 방법으로는 의료영상의 헤더에 기록된 식별 정보에 대한 비식별화 또는 익명화 처리 및 배포 방법[8-15]이 있다. 그러나 이들은 DICOM 및 PACS 규격에 부합하는 영상과 쌍을 이루는 메타데이터에 대한 정형 데이터를 처리하는 것으로 특히 연속된 프레임으로 구성된 비디오의 영상 자체에 포함된 개인식별정보를 처리하기 어렵다. 영상보안분야에서 CCTV 영상으로부터 얼굴 검출 후 스크램블링, 비식별처리, 암호화 등 다양한 프라이버시 보호 기술을 적용하는 방안[16]과 같이 영상 자체에 대한 비식별화 방법도 제안되었는데, 서식이 결정된 의무기록지에 대한 디지털 사본에서의 데이터 위치 및 형식 정보를 이용하는 정형 데이터 처리 방안과 함께 영상에 포함된 환자번호, 이름, 나이 등 민감한 개인식별정보를 OCR과 정규표현식을 이용하여 텍스트 검출 및 인식 후 비식별화 하는 방법[17], CT 뇌신경영상에 대하여 3차원 재구성을 통한 환자의 얼굴 외형이 복원되는 문제를 해결하기 위하여 기존에 MRI 또는 PET 영상을 위한 deface 기법을 적용하여 비식별화 하는 방법[18] 등이 제안된 바 있다.
참고문헌 (22)
박민영, 최민경, "의료정보의 관리와 비식별 화에 관한 법적 과제", 유럽헌법연구, pp.495-534, 2016.
강혜영, 권헌영, "국내외 비식별화 현황 분석을 통한 개인정보 활용 정책 제언", 융합보안 논문지, Vol.19, No.1, pp.41-48, 2019.
Sweeney, L., "k-anonymity: a model for protecting privacy," International Journal on Uncertainty, Fuzziness and Knowledge based Systems, Vol.10, No.5, pp.557-570, 2002.
Portability, Insurance, and Accountability Act. "Guidance Regarding Methods for De-identification of Protected Health Information in Accordance with the Health Insurance Portability and Accountability Act (HIPAA) Privacy Rule.", 2012.
김철중, et al., "의료정보의 2차 이용을 위한 국내 비식별화 대상 정보에 관한 연구", Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, Vol.6, No.8, pp.15-23, 2016.
Whiskerd, N., Dittmann, J., & Vielhauer, C., "A Requirement Analysis for Privacy Preserving Biometrics in View of Universal Human Rights and Data Protection Regulation", In 2018 26th European Signal Processing Conference (EUSIPCO), IEEE, pp. 548-552, sept. 2018.
Jung, Jipmin, et al., "A Determination Scheme for Quasi-Identifiers Using Uniqueness and Influence for De-Identification of Clinical Data", Journal of Medical Imaging and Health Informatics , Vol.10, No.2, pp.295-303, 2020.
Aryanto, K. Y. E., et al., "A web-based institutional DICOM distribution system with the integration of the Clinical Trial Processor (CTP)", Journal of medical systems, Vol.39, No.5, pp.45, 2015.
Aryanto, K. Y. E., van Kernebeek, G., Berendsen, B., Oudkerk, M., & van Ooijen, P. M., "Image De-Identification Methods for Clinical Research in the XDS Environment", Journal of medical systems, Vol.40, No.4, pp.83, 2016.
백종일, et al., "의료 이미지 데이터의 비식별화 방안에 관한 연구", 예술인문사회융합멀티미디어논문지, Vol.6, pp.103-110, 2016.
Silva, J. M., Guerra, A., Silva, J. F., Pinho, E., & Costa, C., "Face De-Identification Service for Neuroimaging Volumes", In 2018 IEEE 31st International Symposium on Computer-Based Medical Systems (CBMS), IEEE, pp.141-145, 2018.
조영탁, 채옥삼., "STB 품질검사를 위한 개선된 지역 방향 패턴 기반 비디오 샷 경계 검출 및 자동 동기화", 융합정보논문지, Vol.9, No.3, pp.8-15, 2019.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.