본 논문은 권투 모션 인식에 대한 연구로서 게임이나, 애니메이션 등의 분야에 응용될 수 있다. 권투 모션의 인식을 위하여 주성분분석과 동적시간정합 알고리즘을 적용한 실험을 하여 비교 연구하였다. 주성분분석 이론은 인식하고자 하는 데이터의 차원을 축소하여 특정 벡터를 추출하여 비교하는 알고리즘이며, 동적시간정합은 두 순차적인 데이터의 유사성을 구하는 알고리즘이다. 모션 인식을 위해 두 상이한 알고리즘을 비교하여 성능을 고찰하고, 권투 모션을 구성하기 위해 만든 모션캡쳐 시스템을 소개한다. 구성된 권투 모션 데이터로부터 모션 그래프를 구성하고, 정규화 과정을 처리한 후, 각각 5명의 연기자의 모션에 대해 인식을 시도하여 실험을 통해 인식률 결과를 보여준다.
본 논문은 권투 모션 인식에 대한 연구로서 게임이나, 애니메이션 등의 분야에 응용될 수 있다. 권투 모션의 인식을 위하여 주성분분석과 동적시간정합 알고리즘을 적용한 실험을 하여 비교 연구하였다. 주성분분석 이론은 인식하고자 하는 데이터의 차원을 축소하여 특정 벡터를 추출하여 비교하는 알고리즘이며, 동적시간정합은 두 순차적인 데이터의 유사성을 구하는 알고리즘이다. 모션 인식을 위해 두 상이한 알고리즘을 비교하여 성능을 고찰하고, 권투 모션을 구성하기 위해 만든 모션캡쳐 시스템을 소개한다. 구성된 권투 모션 데이터로부터 모션 그래프를 구성하고, 정규화 과정을 처리한 후, 각각 5명의 연기자의 모션에 대해 인식을 시도하여 실험을 통해 인식률 결과를 보여준다.
In this paper, we describes the boxing motion recognition which is used in the part of games, animation. To recognize the boxing motion, we have used two algorithms, one is principle component analysis, the other is dynamic time warping algorithm. PCA is the simplest of the true eigenvector-based mu...
In this paper, we describes the boxing motion recognition which is used in the part of games, animation. To recognize the boxing motion, we have used two algorithms, one is principle component analysis, the other is dynamic time warping algorithm. PCA is the simplest of the true eigenvector-based multivariate analyses and often used to reduce multidimensional data sets to lower dimensions for analysis. DTW is an algorithm for measuring similarity between two sequences which may vary in time or speed. We introduce and compare PCA and DTW algorithms respectively. We implemented the recognition of boxing motion on the motion capture system which is developed in out research, and depict the system also. The motion graph will be created by boxing motion data which is acquired from motion capture system, and will be normalized in a process. The result has implemented in the motion recognition system with five actors, and showed the performance of the recognition.
In this paper, we describes the boxing motion recognition which is used in the part of games, animation. To recognize the boxing motion, we have used two algorithms, one is principle component analysis, the other is dynamic time warping algorithm. PCA is the simplest of the true eigenvector-based multivariate analyses and often used to reduce multidimensional data sets to lower dimensions for analysis. DTW is an algorithm for measuring similarity between two sequences which may vary in time or speed. We introduce and compare PCA and DTW algorithms respectively. We implemented the recognition of boxing motion on the motion capture system which is developed in out research, and depict the system also. The motion graph will be created by boxing motion data which is acquired from motion capture system, and will be normalized in a process. The result has implemented in the motion recognition system with five actors, and showed the performance of the recognition.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
모션 인식을 하기 위해서, 먼저 기준이 되는 모션 데이터를 구한다. 권투 연기자로부터 가장 일반적인 데이터를 얻어 데이터베이스에 저장하고, 다른 사용자의 모션과 비교하여 현재의 모션을 인식 및 판단하는 시스템을 연구하였다. 기존 패턴인식 알고리즘을 사용하여 데이터베이스의 모션과 사용자의 모션을 비교하여 인식하는데 있어서, 모션 데이터는 정적 패턴이라기보다는 시간에 따라 변하는 동적 패턴에 해당한다.
제안 방법
동적 시 간정 합 (Dynamic Time Warping''”은 각각 다른 길이의 모션그래프를 비교하여 인식하기 위해 사용했다. 경우에 따라서는 두 그래프의 길이의 차가 2배가 넘는 경우도 있다.
소개한다. 이 시스템은 두 대의 CCD 카메라를 이용하여 실시간으로 움직이는 영상을 캡쳐하고, 전처리과정을 거쳐 2차원 데이터를 추출하고, 그 후, 스테레오 기법"을 이용하여 3차원 데이터를 구성하게 된다. 이렇게 얻어진 3차원 데이터는 후에 모션인식에서 사용된다.
3차원 데이터로 재구성하기 위해 시각차 알고리즘을 이용하여 스테레오 카메라의 영상으로부터 동일한 위치의 점들의 차이를 가지고 z값인 거리를 계산한다. 시각차가 클수록 거리는 가까워지고, 시각차가 줄수록 거리는 멀어진다고 할 수 있다.
권투 연기자의 모션을 데이터베이스화 하고, 5명의 실험 연기자로부터 세 가지 타입으로 나뉘어 연기를 시켜 데이터를 얻었다. 세 가지는 실전모두, 기본모드, 자유 모두로 나뉘며, 각각, 훅, 잽, 스트레이트, 어퍼컷의 동작을 행한다.
가까운 것으로 인식하여 결과를 산출하였다. 두 가지 알고리즘으로 인식된 결과를 위주로 비교 분석을 했다. 알고리즘 인식 속도는 제외하고 인식률에 대한 비교 결과만 보여준다.
알고리즘 인식 속도는 제외하고 인식률에 대한 비교 결과만 보여준다. 또한 알고리즘을 사용하기 전에 정규화를 했는지 안했는지에 대한 비교를 했다. 사전 정규화에는 모션 입력 그래프에 대해 크기 조절, 원점 위치 조정, 노이즈 제거, 조인트 각도 추가 등의 수정 등을 의미한다.
이에 반해 DTW는 원 데이터의 손실은 없지만, 비교 대상의 데이터 길이의 차이가 클 경우는 오히려 알고리즘 적용에 한계가 있다. 본 논문에서 개발 중인 모션캡쳐 시스템을 이용하여 모션 데이터를 얻어, 그 데이터를 정규화 과정을 거쳐 모션 그래프로 재구성한 뒤, 주성분분석 (PCA)와 동적시간정합(DTW) 알고리즘을 적용하여 그 차이를 분석하고 인식률로써 성능 결과를 고찰하였다.
주성분분석 알고리즘을 통해 실험을 했을 경우 연기자의 입력된 3차원 모션 그래프에서 모션 벡터를 데이터베이스의 모션 벡터와 비교를 하여 두 모션 벡터의 거리가 가장 가까운 것으로 인식하여 결과를 산출하였고, 동적 시간 정합 알고리즘으로 연기자의 모션 그래프와 모션 데이터베이스의 각각 다른 길이의 모션 그래프를 동적 프로그래밍 기법을 사용하여 두 그래프의 거리를 계산하여 가까운 것으로 인식하여 결과를 산출하였다. 두 가지 알고리즘으로 인식된 결과를 위주로 비교 분석을 했다.
또한 사용된 캘리브레이션 패턴은 그림4과 같은 8x6 체스보드를 이용했다. 캘리브레이션 입력 및 계산을 위해 OpenCV 라이브러리를 이용해 개발했다. 두 대의 카메라의 평행을 설정하기 위해 최단 거리에서 체스보드 사이의 간격을 확인하고, 먼 거리에서 다시 체스보드 사이의 거리를 측정해서 일치하도록 하여 평행함을 증명하였다.
캘리브레이션을 위해서 두 대의 CCD 카메라는 거리를 정확히 계산하여 일정 거리를 유지 했으며, 카메라의 평행을 유지하도록 시스템을 꾸몄다. 또한 사용된 캘리브레이션 패턴은 그림4과 같은 8x6 체스보드를 이용했다.
대상 데이터
총 60개의 동작에서 실험을 했다. 그런데 실험자의 동작이 애매모호한 경우가 자주 발생하여 실제 인식률에 영향을 끼치므로 인식이 가능한 모션 그래프를 간추려 5명으로부터 총 20개의 동작으로 실험결과를 냈다. 하나의 동작에 4개의 모션그래프가 나오므로 총 80개의 모션 그래프로부터 인식하는 결과를 갖게 된다.
모션의 데이터를 얻기 위해 마커를 들고 있는 것을 알 수 있다. 왼손과 오른손의 두 개의 마커로부터 4개의 신호를 받아 모션 데이터를 구성한다.
세 가지는 실전모두, 기본모드, 자유 모두로 나뉘며, 각각, 훅, 잽, 스트레이트, 어퍼컷의 동작을 행한다. 총 60개의 동작에서 실험을 했다. 그런데 실험자의 동작이 애매모호한 경우가 자주 발생하여 실제 인식률에 영향을 끼치므로 인식이 가능한 모션 그래프를 간추려 5명으로부터 총 20개의 동작으로 실험결과를 냈다.
이론/모형
공분산을 구하여, 고유값와 고유벡터를 구한다. 구해진 고유벡터를 이용하여 kNN 알고리즘을 사용하여 가장 가까운 모션 그래프를 찾게 된다.
t Component Analysis), DCT(Discrete Cosine Transform)등이 있으며, 그밖에 신경회로망, 퍼지, HMM(Hidden Markov Model), SVM(Support Vector Machines)등의 기술이 사용되었다. 모션의 동작 움직임을 차원 축소를 하여 특징 벡터를 구하는 대표적인 알고리즘으로 PCA를 선택했으며, 특징점을 구하지 않고, 모션 동작 움직임의 데이터를 직접 비교 가능한 동적 프로그래밍 기법을 사용하는 DTW(Dynamic Time Warping) 알고리즘을 사용하였다. 두 알고리즘의 장단점을 간략하게 살펴보면, PCA는 데이터의 차원을 죽소하여 처리를 하기 때문에 처리 변수가 많이 줄어들 수 있지만, 데이터의 손실을 가져온다.
모션 그래프를 분류하는 방법은 EucHdean 거리 측정에 의한 표현 값의 거리를 측정하는 Nearest Neighbor 방법으로 구하거나, MLP, RBF, SVM 등 각종 신경 망(Neural Network) 분류기를 이용하여 구할 수 있다. 본 논문에서는 유클리드 거리를 계산하는 kNN 알고리즘을 사용하였다
본 연구에서는 권투 모션을 인식하기 위해 주성분 분석과 동적시간정합 알고리즘을 이용했다. 두 알고리즘을 비교하여 살펴보면, 모션과 같이 동적 패턴의 비교에는 동적 시간 정합이 좀 더 우수하게 나타났다.
구별하여 얻어낸다. 여기서 사용된 알고리즘은 노이즈 제거를 위해 median filter와 위치를 구별하기 위해 이진화를 사용했다 또한 렌즈의 왜곡을 제거하기 위해가장 간단한 기본 모델 식을 이용하여 구현했다 왜곡 계수를 구하기 위해 OpenCV 를 사용하여 구했으며, 각 상수는 化=-0.2457, #0.1112, 口=0.000987, 座=-0.000073 이다.
회득된 영상은 다음 그림 2와 같은 전처리 과정을 거쳐 각각 두 개의 2차원 데이터를 구하게 된다. 전처리 과정에는 간단하게 설명하면, 이진화 방법을 사용했으며, 구해진 마커의 점들은 각각 크기로 구별된다. 현재 권투 모션 인식 시스템에 연결하여 작업을 수행하도록 되어 있기 때문에 네 개의 마커 신호를 사용하고 있다.
성능/효과
캘리브레이션 입력 및 계산을 위해 OpenCV 라이브러리를 이용해 개발했다. 두 대의 카메라의 평행을 설정하기 위해 최단 거리에서 체스보드 사이의 간격을 확인하고, 먼 거리에서 다시 체스보드 사이의 거리를 측정해서 일치하도록 하여 평행함을 증명하였다. 물론 캘리브레이션 실험 자체의 오차를 고려해야 할 것이다
동적시간정합 알고리즘을 이용했다. 두 알고리즘을 비교하여 살펴보면, 모션과 같이 동적 패턴의 비교에는 동적 시간 정합이 좀 더 우수하게 나타났다. 그런데 모션 그래프의 정규화의 영향은 주성분분석이 적게 나타났다 정규화의 과정을 거치지 않은 경우는 오히려 주성분 분석이 우수하게 나타났다.
후속연구
그 밖에 모션이 너무 작거나 움직임의 변화가 많은 경우에 발생한다. 향후 연구 방향은 다른 알고리즘의 실험과 모션의 동작 수를 확대하여 실험할 예정이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.