통계조사 또는 실태조사는 '어떤 조사자가?', '어떤 목적으로?', 그리고 '어떻게?' 작성되었는가에 따라 왜곡의 가능성이 있는 것이 사실이다. 심지어는 통계결과는 '거짓말' 더 나아가서 범죄 또는 비행 등에 관한 통계는 '새빨간 거짓말'로 불리기도 한다. 범죄나 비행에 관한 통계를 신뢰하지 못하는 이유는 여러 가지를 들 수 있겠지만 그 중 대표적인 원인중의 하나가 숨은 범죄(Hidden Crime) 또는 형사사법기관에 보고되지 않는 범죄(Unreported Crime)가 존재한다는 것이다. 이러한 숨은 범죄문제를 보완하기 위해 피해자조사 또는 자기보고식 조사 등의 방법이 사용되고 있으나, 이 또한 범죄의 유형에 따라 과소보고 또는 과대보고의 문제가 있다. 범죄와 비행 그리고 일탈행동에 대한 조사는 매우 민감한 사항들이기 때문에, 조사대상자들은 심리적 부담을 가지게 된다. 이처럼 조사대상자들의 경험을 밝히는 것이 부담스러운 민감한 내용에 대해 진실한 답변을 유도할 수 있는 방법으로 통계학 분야에서 확률화응답모형(randomized response model)이 개발되어 사용되어왔다. 이 기법은 피해자조사 또는 자기보고식 조사의 문제점을 해결할 수 있는 매우 유용한 방법임에도 불구하고, 우리나라에서 범죄학 분야의 조사에서 사용된 경우는 매우 적다. 따라서 이 연구에서는 범죄학 분야연구에 있어 확률화응답모형의 적용가능성을 타진하기 위하여, 확률화응답모형을 활용하여 대학생들을 대상으로 성매매에 대한 내용을 실제로 측정해 보고, 확률화응답모형의 유용성을 확인해 보았다.
통계조사 또는 실태조사는 '어떤 조사자가?', '어떤 목적으로?', 그리고 '어떻게?' 작성되었는가에 따라 왜곡의 가능성이 있는 것이 사실이다. 심지어는 통계결과는 '거짓말' 더 나아가서 범죄 또는 비행 등에 관한 통계는 '새빨간 거짓말'로 불리기도 한다. 범죄나 비행에 관한 통계를 신뢰하지 못하는 이유는 여러 가지를 들 수 있겠지만 그 중 대표적인 원인중의 하나가 숨은 범죄(Hidden Crime) 또는 형사사법기관에 보고되지 않는 범죄(Unreported Crime)가 존재한다는 것이다. 이러한 숨은 범죄문제를 보완하기 위해 피해자조사 또는 자기보고식 조사 등의 방법이 사용되고 있으나, 이 또한 범죄의 유형에 따라 과소보고 또는 과대보고의 문제가 있다. 범죄와 비행 그리고 일탈행동에 대한 조사는 매우 민감한 사항들이기 때문에, 조사대상자들은 심리적 부담을 가지게 된다. 이처럼 조사대상자들의 경험을 밝히는 것이 부담스러운 민감한 내용에 대해 진실한 답변을 유도할 수 있는 방법으로 통계학 분야에서 확률화응답모형(randomized response model)이 개발되어 사용되어왔다. 이 기법은 피해자조사 또는 자기보고식 조사의 문제점을 해결할 수 있는 매우 유용한 방법임에도 불구하고, 우리나라에서 범죄학 분야의 조사에서 사용된 경우는 매우 적다. 따라서 이 연구에서는 범죄학 분야연구에 있어 확률화응답모형의 적용가능성을 타진하기 위하여, 확률화응답모형을 활용하여 대학생들을 대상으로 성매매에 대한 내용을 실제로 측정해 보고, 확률화응답모형의 유용성을 확인해 보았다.
It is true that there is a possibility of distortion in the statistical surveys or actual surveys depending on which investigator, what purpose, and how research method. Even statistical results are more likely to be 'lying', and statistics on crime or delinquent are sometimes referred to as 'whoppe...
It is true that there is a possibility of distortion in the statistical surveys or actual surveys depending on which investigator, what purpose, and how research method. Even statistical results are more likely to be 'lying', and statistics on crime or delinquent are sometimes referred to as 'whopper'. There are many reasons for not trusting statistics on crime or delinquent, but one of the main causes is the existence of a hidden crime or an unreported crime. In order to overcome these hidden crime problems, victim surveys or self-report surveys are being used. However, this method also has the problem of underreporting or overreporting depending on the type of crime. Because investigations into crime, delinquency, and deviant behavior are very sensitive, the subjects have a psychological burden. A randomized response model has been developed and used in the field of statistics as a way to induce a true answer to the sensitive content which is burdensome to reveal the experiences of the survey subjects. This technique is a very useful way to solve the problems of victim surveys or self-report surveys. Nevertheless, there are very few cases in the field of criminology in Korea. Therefore, in order to examine the applicability of the randomized response model in the field of criminology, this study used the randomized response model to actually measure the content of prostitution for college students and the effectiveness of the randomized response model was confirmed.
It is true that there is a possibility of distortion in the statistical surveys or actual surveys depending on which investigator, what purpose, and how research method. Even statistical results are more likely to be 'lying', and statistics on crime or delinquent are sometimes referred to as 'whopper'. There are many reasons for not trusting statistics on crime or delinquent, but one of the main causes is the existence of a hidden crime or an unreported crime. In order to overcome these hidden crime problems, victim surveys or self-report surveys are being used. However, this method also has the problem of underreporting or overreporting depending on the type of crime. Because investigations into crime, delinquency, and deviant behavior are very sensitive, the subjects have a psychological burden. A randomized response model has been developed and used in the field of statistics as a way to induce a true answer to the sensitive content which is burdensome to reveal the experiences of the survey subjects. This technique is a very useful way to solve the problems of victim surveys or self-report surveys. Nevertheless, there are very few cases in the field of criminology in Korea. Therefore, in order to examine the applicability of the randomized response model in the field of criminology, this study used the randomized response model to actually measure the content of prostitution for college students and the effectiveness of the randomized response model was confirmed.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이 기법은 피해자조사 또는 자기보고식 조사의 문제점을 해결할 수 있는 매우 유용한 방법임에도 불구하고, 우리나라에서 범죄학 분야의 조사에서 사용된 경우는 매우 적다. 따라서 이 연구에서는 범죄학 분야연구에 있어 확률화응답모형의 적용가능성을 타진하기 위하여, 확률화응답모형을 활용하여 대학생들을 대상으로 성매매에 대한 내용을 실제로 측정해 보고, 확률화 응답모형의 유용성을 확인해 보고자 한다.
따라서 이 연구에서는 직접질문모형과 무관질문모형, 강요질문모형, 관련질문모형을 만들어서 각각의 모형에 “예”라고 응답한 경우의 비율과 분산을 구할 것이다. 또한 구해진 결과 값을 비교한 후, 민감한 문제에 대한 설문조사에서는 확률장치를 이용하여 응답하게 하는 확률화응답기법이 유용한 도구가 될 수 있다는 것을 증명하고[1], 연구 윤리를 거스르지 않고서도 과학적인 연구가 가능하다는 것을 제시하고, RRT의 효율성을 비교분석 하고자 한다.
이러한 확률화응답기법은 응답자의 신분이나 밝히기를 꺼려하는 비밀을 보장함으로써 응답자로부터 민감한 질문에 보다 정확한 응답을 얻을 수 있다. 또한, 민감한 속성에 대해 직접 질문을 하면 개인정보를 보호하기 어렵기 때문에, 개인정보를 보다 잘 보호하며 올바른 응답을 얻기 위해 조사자는 확인할 수 없으며 조사 대상자만이 확인할 수 있는 확률장치를 사용하여 설문 문항에 대하여 응답할 수 있는 선택의 기회를 주어 조사에 응하도록 한다. 응답자들이 밝히기를 꺼려하는 민감한 내용에 대해 응답자의 진실 된 응답을 유도하는 방법인 확률화응답기법이 최근 국내외에서 많이 연구 및 개발되고 있다[3].
이 연구는 통계학 분야에서 활발히 개발되어 온 확률화응답모형을 소개하였고, 이것이 민감 사항 조사연구에 매우 유용한 도구가 될 수 있다는 점을 사례연구를 통해 확인하고, RRT의 효율성을 알아보고자 하였다. 이를 위해 4가지 중요한 확률화응답모형의 형태를 알아보고, 이것들이 어떻게 활용되는지 일정한 대가를 주고 성을 사고파는 행위인 성매매에 대해 사례를 통해 설명하였다.
확률장치를 이용했을 때와 확률장치를 이용하지 않고 직접질문을 했을 때의 모비율 중 확률장치를 이용하여 응답했을 때의 모비율이 더 크다는 것을 확인하고자 하는 것이다.
가설 설정
이렇게 무관질문모형을 이용할 때에는 관련질문모형에 비해 또 하나의 모비율 즉, Y에 속하는 사람의 비율을 알아야 한다는 것이다. 이때 질문1은 민감한 속성을 갖는 모비율이며, 는 질문2는 속성 Y가 갖는 모비율이라 가정한다. 이때, n명의 표본 중 “예”라고 응답할 비율은 다음과 같다.
확률화응답기법은 관련질문모형, 무관질문모형, 강요 질문모형 그리고 직접질문모형에 대해 응답할 응답자들은 모집단으로부터 표본이 단순임의추출 되었다고 가정하며, 응답자들은 진실된 응답을 한다고 가정한다.
제안 방법
따라서 이 연구에서는 직접질문모형과 무관질문모형, 강요질문모형, 관련질문모형을 만들어서 각각의 모형에 “예”라고 응답한 경우의 비율과 분산을 구할 것이다.
사전조사와 마찬가지로 조사대상 학생들을 대상으로 4가지의 질문모형을 만들어 중복응답 없이 하나의 설문지에 대해서만 응답하게 하였다. 4가지 질문모형을 6개 단과대학에 재학 중인 학생 10명씩 뽑아 응답하게 하였다.
우선 확률화응답모형에서도 여전히 거짓으로 응답할 가능성은 남아있으며, 응답자의 신분을 보호하기 위해 조사자가 응답결과를 알 수 없도록 하였으나 완벽하게 거짓응답을 봉쇄할 수 있는 방법은 없다. 설문문항에서 선택 확률을 작게 할수록 응답자를 보호해주고, 값을 크게 할수록 익명성을 덜 보호해주기 때문에 이번 연구에서 선택 확률을 작게 선정하였다.
응답자에게 응답을 요할 때 민감한 사항에 대한 응답자의 신변을 보고해주고 질문모형에 대해 선택 기회를 주어 응답할 수 있도록 확률장치인 주사위를 사용하였고, 설문이 끝난 후에 조사자가 응답자의 응답결과를 확인하지 못하도록 편지 동봉한 후 설문지를 회수하였다.
3%로 나타났다. 이 연구에서 알고자 하는 것이 확률장치를 이용했을 때와 확률장치를 이용하지 않고 직접질문을 했을 때의 응답비율 중 확률장치를 이용하여 응답했을 때의 응답비율이 더 큰지를 확인하고 하는 것이기 때문에 각각의 모형을 비교하여보았다. 그 결과 관련질문모형-직접질문모형Q1은 0.
이 연구는 통계학 분야에서 활발히 개발되어 온 확률화응답모형을 소개하였고, 이것이 민감 사항 조사연구에 매우 유용한 도구가 될 수 있다는 점을 사례연구를 통해 확인하고, RRT의 효율성을 알아보고자 하였다. 이를 위해 4가지 중요한 확률화응답모형의 형태를 알아보고, 이것들이 어떻게 활용되는지 일정한 대가를 주고 성을 사고파는 행위인 성매매에 대해 사례를 통해 설명하였다. 민감한 사안에 대해서도 충분히 확률화응답모형을 이용하는 것이 가능하며, 연구윤리를 거스르지 않고도 과학적인 연구가 가능하다는 것을 보여준다는 의의가 있다.
사전조사로 정해진 질문 “일정한 대가를 지불하고 성을 사고파는 행위를 해 본 경험이 있습니까?”를 본 조사에 사용하였다. 정해진 주제를 관련질문모형, 무관질문모형, 강요질문모형, 직접질문모형 이렇게 4가지 형태의 질문모형으로 설정하고, 직접질문을 제외한 각 질문 모형마다 확률장치를 이용하여 확률을 정해주었다. 주사위를 던졌을 때, 1과 2가 나오면 질문 1에 응답하고, 1과 2가 아닌 다른 숫자가 나오게 되면 질문 2에 응답하게 하였다.
첫 번째 질문에는 직접질문을 하고, 두 번째 질문에는 무조건 “예” 라고만 답할 수 있는 강요질문 응답모형을 사용하게 된다.
확률화응답장치를 이용한 민감 사항 설문조사를 시행하기에 앞서 K대학교 학생들이 어떠한 부분에 대해 민감하다고 느끼는지 그 정도를 알아보기 위해 성생활, 환각제, 자살, 살인 등의 12가지 질문을 가지고 사전조사를 실시하였다.
대상 데이터
사전조사와 마찬가지로 조사대상 학생들을 대상으로 4가지의 질문모형을 만들어 중복응답 없이 하나의 설문지에 대해서만 응답하게 하였다. 4가지 질문모형을 6개 단과대학에 재학 중인 학생 10명씩 뽑아 응답하게 하였다. 이때, 남과 여의 응답비율은 똑같이 하여 각 질문에 대해 5명씩, 총 240명을 조사하였다.
K대학교 8개 단과대학 중 6개 단과대학 학생들을 대상으로 google을 이용하여 설문지를 작성 후 눈덩이 표본 추출을 통해 여자 118명 남자 65명 총 183명을 사전조사 대상자로 선정하였다.
4가지 질문모형을 6개 단과대학에 재학 중인 학생 10명씩 뽑아 응답하게 하였다. 이때, 남과 여의 응답비율은 똑같이 하여 각 질문에 대해 5명씩, 총 240명을 조사하였다.
성능/효과
이 연구에서 알고자 하는 것이 확률장치를 이용했을 때와 확률장치를 이용하지 않고 직접질문을 했을 때의 응답비율 중 확률장치를 이용하여 응답했을 때의 응답비율이 더 큰지를 확인하고 하는 것이기 때문에 각각의 모형을 비교하여보았다. 그 결과 관련질문모형-직접질문모형Q1은 0.353과 0.183, 무관질문모형-직접질문모형Q2는 0.351과 0.18, 강요질문모형-직접질문모형Q3은 0.646과 0.183으로 확률장치를 이용하여 응답했을 때가 응답비율이 더 크게 나왔다.
민감 사항을 관련질문모형, 무관질문모형, 강요질문 모형 그리고 직접질문모형으로 나타내어 설문조사 한 결과 “예”라고 응답한 비율은 각각 35.3%, 35.1%, 64.6%, 18.3%로 나타났다.
9%가 응답되었다. 사전조사 결과, 183명 중 76명(41.5%)로 일정한 대가를 주고받으며 성을 사고 판 경험이 있는지에 대한 성매매여부가 솔직하게 응답하지 않겠다고 응답한 비율이 제일 높았기 때문에 본조사의 주제로 선정하였으며, 무려 41.5%라는 높은 비율은 솔직하게 대답하지 못하겠다는 의미로서 확률화응답기법을 통해 확률장치에 대한 필요성이 있다고 생각되었다.
이때, 분산 값 또한 확률장치를 이용한 응답모형이 직접질문모형보다 모두 작게 나와야 하는데 강요질문을 제외한 나머지 모형들의 분산 값이 직접질문의 분산 값 보다 크다는 것을 확인할 수 있다. 이 부분은 연구의 한계점이다.
질의응답
핵심어
질문
논문에서 추출한 답변
조사의 신뢰도를 향상시키기 위해 무엇을 줄여야 하는가?
표본오차는 표본의 크기를 증가시키거나 상황에 따라 적합한 표본추출법을 사용해 감소시키는 등 이론적으로 측정이 가능한 단계에 이르렀다. 하지만 상대적으로 비표본오차는 표본오차보다 훨씬 크며, 이론적으로 정립되지 않았을 뿐만 아니라 조사의 신뢰도를 향상시키기 위해서는 비표본오차를 줄이는 것이 필수적이기 때문에 비표본오차를 줄이기 위한 연구가 활발하게 진행되고 있다. 예를 들면, 동성연애, 약물복용, 성관계 여부, 집안사정 등과 같은 사회적으로나 개인적으로 매우 민감한 문제에 대해 직접질문 방식으로 조사할 경우 응답자가 응답을 피하거나 거짓응답을 함으로써 비표본오차가 발생하는 경우가 많아진다.
확률화응답기법에서 개인정보를 어떻게 보호하는가?
이러한 확률화응답기법은 응답자의 신분이나 밝히기를 꺼려하는 비밀을 보장함으로써 응답자로부터 민감한 질문에 보다 정확한 응답을 얻을 수 있다. 또한, 민감한 속성에 대해 직접 질문을 하면 개인정보를 보호하기 어렵기 때문에, 개인정보를 보다 잘 보호하며 올바른 응답을 얻기 위해 조사자는 확인할 수 없으며 조사 대상자만이 확인할 수 있는 확률장치를 사용하여 설문 문항에 대하여 응답할 수 있는 선택의 기회를 주어 조사에 응하도록 한다. 응답자들이 밝히기를 꺼려하는 민감한 내용에 대해 응답자의 진실 된 응답을 유도하는 방법인 확률화응답기법이 최근 국내외에서 많이 연구 및 개발되고 있다[3].
확률화응답모형은 무엇을 할 때 사용하는 방법인가?
범죄와 비행 그리고 일탈행동에 대한 조사는 매우 민감한 사항들이기 때문에, 조사대상자들은 심리적 부담을 가지게 된다. 이처럼 조사대상자들의 경험을 밝히는 것이 부담스러운 민감한 내용에 대해 진실한 답변을 유도할 수 있는 방법으로 통계학 분야에서 확률화응답모형(randomized response model)이 개발되어 사용되어왔다[1].
참고문헌 (5)
박철현, 정혜원, 장안식, "범죄학 연구에서 확률화 응답모형(RRM)의 활용: 성매매조사의 개선 방안," 여성연구, 제84권, pp.213-237, 2013.
S. L. Warner, "Randomized response ; A survey technique for eliminating evasive answer bias," Journal of the American Statistical Association, Vol.60, pp.63-69, 1965.
B. G. Greenberg, R. R. Kubler, J. R. Abernathy, D. G. and Horvitz, "Applications of the RR technique in obtaining quantitative data," Journal of the American Statistical Association, Vol.66, pp.243-250, 1971.
W. Drane, "Randomized Response to More Than One Question," Proceedings of the American Statistical Association, Social Statistics Section, pp.395-397, 1975.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.