최근 생성형 Artificial Intelligence(이하 AI)와 인공지능에 대한 수요가 높아짐에 따라, 오남용에 대한 심각성이 대두되고 있다. 그러나, 이상행위 탐지를 극대화한 지능형 CCTV는 군과 경찰에서 범죄 예방에 큰 도움이 되고 있다. AI는 인간이 가르쳐준 대로 학습을 수행한 후, 자가 학습을 진행한다. AI는 학습된 결과에 따라 판단을 하기 때문에, 학습 시 특징을 명확하게 이해해야만 한다. 그러나, 인간이 판단하기에도 모호한 이상한 행위와 비정상 행위의 시각적 판단이 어려운 경우가 많다. 이것을 인공지능의 눈으로 학습하기란 매우 어렵고, 학습을 한 결과는 오탐, 미탐 그리고 과탐이 매우 많아진다. 이에 대해 본 논문에서는 AI의 이상한 행위와 비정상 행위의 학습을 명확하게 하기 위한 기준과 방법을 제시하고, 지능형 CCTV의 오탐, 미탐 그리고 과탐에 대한 판단 능력을 최대화 하기 위한 학습 방안을 제시하였다. 본 논문을 통해, 현재 활용 중인 지능형 CCTV의 인공지능 엔진 성능을 극대화가 가능하고, 오탐율과 미탐율의 최소화가 가능할 것으로 기대된다.
최근 생성형 Artificial Intelligence(이하 AI)와 인공지능에 대한 수요가 높아짐에 따라, 오남용에 대한 심각성이 대두되고 있다. 그러나, 이상행위 탐지를 극대화한 지능형 CCTV는 군과 경찰에서 범죄 예방에 큰 도움이 되고 있다. AI는 인간이 가르쳐준 대로 학습을 수행한 후, 자가 학습을 진행한다. AI는 학습된 결과에 따라 판단을 하기 때문에, 학습 시 특징을 명확하게 이해해야만 한다. 그러나, 인간이 판단하기에도 모호한 이상한 행위와 비정상 행위의 시각적 판단이 어려운 경우가 많다. 이것을 인공지능의 눈으로 학습하기란 매우 어렵고, 학습을 한 결과는 오탐, 미탐 그리고 과탐이 매우 많아진다. 이에 대해 본 논문에서는 AI의 이상한 행위와 비정상 행위의 학습을 명확하게 하기 위한 기준과 방법을 제시하고, 지능형 CCTV의 오탐, 미탐 그리고 과탐에 대한 판단 능력을 최대화 하기 위한 학습 방안을 제시하였다. 본 논문을 통해, 현재 활용 중인 지능형 CCTV의 인공지능 엔진 성능을 극대화가 가능하고, 오탐율과 미탐율의 최소화가 가능할 것으로 기대된다.
Recently, as the demand for Generative Artificial Intelligence (AI) and artificial intelligence has increased, the seriousness of misuse and abuse has emerged. However, intelligent CCTV, which maximizes detection of abnormal behavior, is of great help to prevent crime in the military and police. AI ...
Recently, as the demand for Generative Artificial Intelligence (AI) and artificial intelligence has increased, the seriousness of misuse and abuse has emerged. However, intelligent CCTV, which maximizes detection of abnormal behavior, is of great help to prevent crime in the military and police. AI performs learning as taught by humans and then proceeds with self-learning. Since AI makes judgments according to the learned results, it is necessary to clearly understand the characteristics of learning. However, it is often difficult to visually judge strange and abnormal behaviors that are ambiguous even for humans to judge. It is very difficult to learn this with the eyes of artificial intelligence, and the result of learning is very many False Positive, False Negative, and True Negative. In response, this paper presented standards and methods for clarifying the learning of AI's strange and abnormal behaviors, and presented learning measures to maximize the judgment ability of intelligent CCTV's False Positive, False Negative, and True Negative. Through this paper, it is expected that the artificial intelligence engine performance of intelligent CCTV currently in use can be maximized, and the ratio of False Positive and False Negative can be minimized..
Recently, as the demand for Generative Artificial Intelligence (AI) and artificial intelligence has increased, the seriousness of misuse and abuse has emerged. However, intelligent CCTV, which maximizes detection of abnormal behavior, is of great help to prevent crime in the military and police. AI performs learning as taught by humans and then proceeds with self-learning. Since AI makes judgments according to the learned results, it is necessary to clearly understand the characteristics of learning. However, it is often difficult to visually judge strange and abnormal behaviors that are ambiguous even for humans to judge. It is very difficult to learn this with the eyes of artificial intelligence, and the result of learning is very many False Positive, False Negative, and True Negative. In response, this paper presented standards and methods for clarifying the learning of AI's strange and abnormal behaviors, and presented learning measures to maximize the judgment ability of intelligent CCTV's False Positive, False Negative, and True Negative. Through this paper, it is expected that the artificial intelligence engine performance of intelligent CCTV currently in use can be maximized, and the ratio of False Positive and False Negative can be minimized..
이는 학습 시 편향성을 극복하고 인간의 판단에 의한 라벨링 등의 오류 수정을 통해 인공지능이 정확한 학습을 수행하도록 하는데 매우 중요한 영역이다[1,2,3,4]. 본 논문은 지능형 CCTV와 AI의 시각적 판단 능력을 확보하기 위한 장비에서의 검출 목적성에 맞게 해당 이상 행위와 비정상 행위의 학습 기준을 제시하고자 한다. 이는 사람이 느끼는 현장의 분위기와 감성, 시각적 요소등과 결합하여 이를 학습에 반영하고, 특히, 기계적인 영상에서의 문제점을 개선하기 위한 학습 방법을 제시함으로써 왜곡된 학습 결과를 바로잡아 판단 오류율을 최소화하기 위한 방안을 제시하였다.
본 논문은 지능형 CCTV와 AI의 시각적 판단 능력을 확보하기 위한 장비에서의 검출 목적성에 맞게 해당 이상 행위와 비정상 행위의 학습 기준을 제시하고자 한다. 이는 사람이 느끼는 현장의 분위기와 감성, 시각적 요소등과 결합하여 이를 학습에 반영하고, 특히, 기계적인 영상에서의 문제점을 개선하기 위한 학습 방법을 제시함으로써 왜곡된 학습 결과를 바로잡아 판단 오류율을 최소화하기 위한 방안을 제시하였다. 본 논문에서는 이상행위와 비정상 행위를 사전에 제시하고 본론에서는 오탐과 미탐 문제점이 발생될 가능성이 높은 다양한 현상과 상황을 해결하기 위한 방안을 제공하여 Ai-Hub를 통해 학습 데이터로 활용 가능하도록 하였다[5].
본 논문은 AI 기반 지능형 CCTV를 이용한 이상행위와 비정상 행위를 탐지할 때, 오류율을 최소화 가능한 학습 방법을 제시하였고, 이를 통해 향후 지능형 CCTV의 행위 분석 시 오탐율과 미탐율을 개선가능하도록 학습 방안을 제시하였다. 실제 인공지능 학습에서의 최적화를 위한 학습 데이터 개선은 모델 학습에 지대한 영향을 미친다는 사실을 확인하였다.
제안 방법
이는 사람이 느끼는 현장의 분위기와 감성, 시각적 요소등과 결합하여 이를 학습에 반영하고, 특히, 기계적인 영상에서의 문제점을 개선하기 위한 학습 방법을 제시함으로써 왜곡된 학습 결과를 바로잡아 판단 오류율을 최소화하기 위한 방안을 제시하였다. 본 논문에서는 이상행위와 비정상 행위를 사전에 제시하고 본론에서는 오탐과 미탐 문제점이 발생될 가능성이 높은 다양한 현상과 상황을 해결하기 위한 방안을 제공하여 Ai-Hub를 통해 학습 데이터로 활용 가능하도록 하였다[5]. 마지막으로 결론을 통해 학습 시 휴먼 피처링을 통한 특장점 추출의 중요성을 강조하였다.
민간의 경우, 직접 촬영 시 각종 법적 규정을 준수해야만 하고 시나리오 기반이거나, 직접 촬영에서 수집된 데이터는 개인정보보호 및 영상정보보호법에 저촉되지 않는 한도내에서 프레임별로 잘라서 사용해야만 한다. 이를 통해, 실질적으로 업체들과 소통 후 개선 방안을 제시하여 촬영을 진행하였다. 그 결과, 실질적인 AI 학습 결과가 개선됨을 확인하였다.
성능/효과
이를 통해, 실질적으로 업체들과 소통 후 개선 방안을 제시하여 촬영을 진행하였다. 그 결과, 실질적인 AI 학습 결과가 개선됨을 확인하였다. 개선된 학습 데이터 결과는 한국지능정보사회진흥원의 Ai-Hub에서 개방 중이다[5].
표 2에서 제시하고 있는 것은 실제 수행기관들과 협의하면서 실질적인 데이터의 모델 검증 결과를 토대로 수정 보완한 고려사항을 제시한 것이다. 업체들의 인공지능 데이터 사업을 진행하면서 발생하는 많은 문제점들을 검토하고 분석한 결과, 수집 데이터의 문제가 대부분이며 라벨링에서의 정확도와 재현율이 심각한 성능을 좌우 한다는 것을 발견하였다. 이에 대해서 지능형 CCTV를 이용한 학습 시 고려해야 할 사항들을 간략하게나마 제시하고 이를 근거로 데이터를 수집하면 성능이 향상됨을 확인할 수 있다.
업체들의 인공지능 데이터 사업을 진행하면서 발생하는 많은 문제점들을 검토하고 분석한 결과, 수집 데이터의 문제가 대부분이며 라벨링에서의 정확도와 재현율이 심각한 성능을 좌우 한다는 것을 발견하였다. 이에 대해서 지능형 CCTV를 이용한 학습 시 고려해야 할 사항들을 간략하게나마 제시하고 이를 근거로 데이터를 수집하면 성능이 향상됨을 확인할 수 있다.
표2에서 제시한 바와 같이, 학습 시 수집 데이터의 고려사항을 최대한 반영하여 수집을 해도 탐지율이 70% 이상이 나올 수 없는 조건임을 확인하였다. 그러므로 지능형 CCTV의 탐지율을 향상시키기 위해서는 편향성과 조도, 역광 등을 고려한 수집 설계가 매우 중요하다.
그러므로 지능형 CCTV의 탐지율을 향상시키기 위해서는 편향성과 조도, 역광 등을 고려한 수집 설계가 매우 중요하다. 또한, 학습 결과를 확인 후, 라벨링 즉, 휴먼 피처링을 통한 특장점 추출을 좀더 명확하게 프레임별로 제시함으로써 탐지율과 학습 효율을 극대화할 수 있음을 확인하였다.
그러므로 이러한 문제점을 해결하고 인공지능이 사람의 눈으로 확인하는 객체 추적 기술에서의 Re-ID(재식별) 기술 핵심요소는 특징 추출, 거리 측정에 따른 지속적인 객체의 시각적 관점과 시계열의 연속성과 일관성 확보가 매우 중요하다. 또한, 정상적인 행위와 비정상적인 이상행위를 구분하고 탐지하기 위해서 무조건 정상 외엔 이상행위라고 판단하여 학습시키는 방식은 학습된 결과를 확인하는 관제자들의 업무 가중과 알람의 최대치에 따른 문제로 이어지므로 좀더 명확한 인간의 식별 능력을 유사하게 판단하게끔 학습 시키는 것이 매우 중요함을 확인하였다. 개인정보와 관련된 법적 기준과 영상데이터의 종류도 중요하다.
, 그림 3의 가운데 객체는 짙은 남색으로 이 역시 빛의 산란 현상(빛의 퍼짐)으로 인해 해상도와 빛의 각도에 의한 색의 왜곡 현상이 발생하여 오류로 식별한 것이다. 마지막 세 번째 우측 객체는 가방을 메고 있지만 가방을 식별하지 못한 것이고, 긴팔 티셔츠를 입었지만 빛의 역광으로 인한 가방과 옷의 색 판단이 불가능하였고, 긴팔과 반팔을 빛의 그림자로 구분하지 못하고 주변의 조명과 빛의 조도 영향으로 인한 객체 식별 불가한 상황으로 탐지 결과를 확인할 수 있다.
따라서, 학습 시 휴먼 피처링을 통해 외곽을 만들어 주거나 음영을 변경해서 학습해야만 한다. 다른 해결 방법 하나는 사람이나 자동차 객체를 라벨링 할 경우, 대부분 바운딩 박스를 사용하는 경우가 많지만 이러한 색 번짐과 색이 객체와 일원화된 형태일 경우에는 폴리곤이나 세그멘테이션 기법의 외곽 라인을 이용한 라벨링 방법을 사용하면 검출과 식별률이 높아 짐을 알수 있었다. 그 외에 다양한 각도로 해당 대상자를 학습하고, 편향성과 색감에 대한 빛의 변화를 학습하는 것도 매우 중요하다.
Re-ID 식별의 경우 수행기관별로 탐지 성능이 매우 저조하므로 탐지 결과에 사용하는 알고리즘을 TOP 5, 혹은 TOP 10처럼 5개나 10개를 탐지한것으로 출력하면 성능이 우선인것처럼 표현한다. 그러나 본 논문에서 제시한 특장점 수정 보완 및 정제 방법을 이용한 결과, 어노테이션 값을 제대로 입력하여 꾸준한 학습을 수행하면 5가지 선택형 답이 아니라 1개의 객체에 대해 70% 이상의 확률을 나타냄을 확인하였다. 정확도, 정밀도, 재현율을 기준으로 표기하는 F1 Score나 AP(Average Precision), mAP(mean Average Precision)를 사용하는 객체 검출과 정확도에서 높은 탐지율을 확인하였다.
그러나 본 논문에서 제시한 특장점 수정 보완 및 정제 방법을 이용한 결과, 어노테이션 값을 제대로 입력하여 꾸준한 학습을 수행하면 5가지 선택형 답이 아니라 1개의 객체에 대해 70% 이상의 확률을 나타냄을 확인하였다. 정확도, 정밀도, 재현율을 기준으로 표기하는 F1 Score나 AP(Average Precision), mAP(mean Average Precision)를 사용하는 객체 검출과 정확도에서 높은 탐지율을 확인하였다. 이에 대한 최종 결과는 제3자 검증으로 TTA를 통해 확인되었다.
이에 대한 최종 결과는 제3자 검증으로 TTA를 통해 확인되었다. 본 논문에서 제시하는 방법을 사용한 결과, 수행 기관별로 수용 범위가 매우 다양하기 때문에 예시와 결과를 수치로 표현하지 못하는 점이 존재하지만 탐지 성능과 학습 성능이 목표치 평균 70% 대비 최소 10~20% 이상 목표치에서 향상됨을 확인하였다.
특히, 부족한 데이터를 위해 시나리오 중심의 다양한 영상과 행위에 대한 빅데이터를 구현하여 탐지 성능과 시험을 반복 수행할 필요가 있다. 데이터 확보와 탐지 성능 개선을 위해서는 지방자치단체의 CCTV 데이터와 국방 관련 데이터, 경찰청, 소방청 등 정부 기관에서 제공하는 데이터를 사전 정제 작업과 지속적인 행위 분석에 따른 특장점 분류와 분석의 세밀함이 더해져야만 좀더 명확한 인공지능 판단 능력이 개선됨을 알 수 있었다.
본 논문은 AI 기반 지능형 CCTV를 이용한 이상행위와 비정상 행위를 탐지할 때, 오류율을 최소화 가능한 학습 방법을 제시하였고, 이를 통해 향후 지능형 CCTV의 행위 분석 시 오탐율과 미탐율을 개선가능하도록 학습 방안을 제시하였다. 실제 인공지능 학습에서의 최적화를 위한 학습 데이터 개선은 모델 학습에 지대한 영향을 미친다는 사실을 확인하였다. 생성형 AI 데이터 결과를 확인해 보면, 휴먼 피처링의 프로세스가 존재함에도 오류가 발생하는 것은 제대로 이 오류 검증 프로세스를 활용하지 못한 것이고, 학습용 데이터의 명확한 특징점 추출 학습은 모델의 올바른 학습 결과를 반영한다는 사실이 입증되었다.
실제 인공지능 학습에서의 최적화를 위한 학습 데이터 개선은 모델 학습에 지대한 영향을 미친다는 사실을 확인하였다. 생성형 AI 데이터 결과를 확인해 보면, 휴먼 피처링의 프로세스가 존재함에도 오류가 발생하는 것은 제대로 이 오류 검증 프로세스를 활용하지 못한 것이고, 학습용 데이터의 명확한 특징점 추출 학습은 모델의 올바른 학습 결과를 반영한다는 사실이 입증되었다. 따라서 본 연구는 향후, 지능형 CCTV 자동 탐지 성능에서 학습 시 수집 데이터의 오류를 최소화하고, 휴먼피처링을 통한 특장점 추출 학습이 반영된다면, 오탐율 극복화 방안에 활용 가능할 수 있을것으로 기대된다.
후속연구
본 논문에서 제시한 기준들을 이용하여 인공지능 모델의 탐지 성능 개선을 위해서는 많은 시간과 노력이 필요하다. 첫째, 시간적 요소인 날씨와 계절 변화에 따른 영상 결과물의 변화 둘째, 디지털 장비에 출력되는 영상물들의 특징을 명확히 인지한 후 시각적 왜곡 현상을 극복하기 위한 대안을 반영해야만 한다, 마지막으로 목적에 맞는 행위 분석 정의와 시나리오등을 통한 부족한 데이터의 확보 방안등이 절대적으로 필요하다.
본 논문에서 제시한 기준들을 이용하여 인공지능 모델의 탐지 성능 개선을 위해서는 많은 시간과 노력이 필요하다. 첫째, 시간적 요소인 날씨와 계절 변화에 따른 영상 결과물의 변화 둘째, 디지털 장비에 출력되는 영상물들의 특징을 명확히 인지한 후 시각적 왜곡 현상을 극복하기 위한 대안을 반영해야만 한다, 마지막으로 목적에 맞는 행위 분석 정의와 시나리오등을 통한 부족한 데이터의 확보 방안등이 절대적으로 필요하다. 특히, 부족한 데이터를 위해 시나리오 중심의 다양한 영상과 행위에 대한 빅데이터를 구현하여 탐지 성능과 시험을 반복 수행할 필요가 있다.
첫째, 시간적 요소인 날씨와 계절 변화에 따른 영상 결과물의 변화 둘째, 디지털 장비에 출력되는 영상물들의 특징을 명확히 인지한 후 시각적 왜곡 현상을 극복하기 위한 대안을 반영해야만 한다, 마지막으로 목적에 맞는 행위 분석 정의와 시나리오등을 통한 부족한 데이터의 확보 방안등이 절대적으로 필요하다. 특히, 부족한 데이터를 위해 시나리오 중심의 다양한 영상과 행위에 대한 빅데이터를 구현하여 탐지 성능과 시험을 반복 수행할 필요가 있다. 데이터 확보와 탐지 성능 개선을 위해서는 지방자치단체의 CCTV 데이터와 국방 관련 데이터, 경찰청, 소방청 등 정부 기관에서 제공하는 데이터를 사전 정제 작업과 지속적인 행위 분석에 따른 특장점 분류와 분석의 세밀함이 더해져야만 좀더 명확한 인공지능 판단 능력이 개선됨을 알 수 있었다.
생성형 AI 데이터 결과를 확인해 보면, 휴먼 피처링의 프로세스가 존재함에도 오류가 발생하는 것은 제대로 이 오류 검증 프로세스를 활용하지 못한 것이고, 학습용 데이터의 명확한 특징점 추출 학습은 모델의 올바른 학습 결과를 반영한다는 사실이 입증되었다. 따라서 본 연구는 향후, 지능형 CCTV 자동 탐지 성능에서 학습 시 수집 데이터의 오류를 최소화하고, 휴먼피처링을 통한 특장점 추출 학습이 반영된다면, 오탐율 극복화 방안에 활용 가능할 수 있을것으로 기대된다.
참고문헌 (7)
김승희, 류동주, "비정형데이터의 AI학습을 위한 영상/이미지 데이터 품질 향상 방법", 융합보안논문지, 제23권 2호, 2023.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.