초등학생의 성별에 따른 차별기능문항 분석: 수학 과학 성취도 국제비교연구(TIMSS) 2007 수학영역을 중심으로
Detecting Differential Item Functioning based on Gender: Field of Mathematics in the TIMSS 2007

水産海洋敎育硏究 = Journal of fisheries and marine sciences education, v.29 no.3 = no.87, 2017년, pp.757 - 766  

이승배 (부산대학교) ,  김석우 (부산대학교)

This study investigated not only the existence of differently functioned item due to gender but also domain. In this study, the randomly selected data of TIMSS 2007, which consist of 681 male and 646 women, were analyzed. To detect differently functioned items, this study employed Raju method. For R...


문제 정의

  •  본 연구는 TIMSS 2007 수학영역(4학년)에서 남학생과 여학생 집단에게 유리 또는 불리한 차별기능문항을 추출하고 추출된 차별기능문항이 측정하고자 하는 내용영역 및 인지영역에 대한 성별에 따른 차이 분석을 목적으로 한다.
  • 본 연구는 TIMSS 2007 수학영역(4학년)에서 남학생과 여학생 집단에게 유리 또는 불리한 차별기능문항을 추출하고 추출된 차별기능문항이 측정하고자 하는 내용영역 및 인지영역에 대한 성별에 따른 차이 분석을 목적으로 하였다. 영어로 제작된 전체 70문항 중 27문항을 한국어로 번역한 도구를 사용하여 얻은 결과이므로 본래의 검사를 정확하게 반영한다고 할 수는 없으나 국제비교연구에서 사용되는 검사를 사용했다는 점에서 본 연구에서 사용한 검사도구가 신뢰롭고 타당하다고 할 수 있으며 연구의 결과가 주는 시사점은 크다고 할 수 있다.
  • 본 연구는 TIMSS 2007 수학영역에 대하여 성별에 따른 차별기능문항 추출과 추출된 차별기능 문항이 측정하고자 하는 내용영역 및 인지영역에 대한 성별에 따른 차이 분석을 목적으로 하였으며 두 가지의 제한점을 지니고 있다.
  • 본 연구는 TIMSS 2007 수학영역에서 차별기능 문항을 추출하기 위하여 정답 문항은 1점, 오답 이거나 무응답인 문항은 0점으로 점수화시켜 자료를 분석하였다.
차별적으로 기능하는 문항이 생기는 이유는? 차별적으로 기능하는 문항이란 인간의 잠재적 특성을 측정하는 검사 문항들이 능력이 같음에도 불구하고 집단의 특성 때문에 어떤 집단에서는 쉬운 문항으로 다른 집단에서는 어려운 문항으로 기능하는 것을 말한다(Kim Sukwoo, 1991; Kim Sukwoo-Park Haejin, 1994). 차별적으로 기능하는 문항은 검사의 측정학적 특성상의 문제일 수도 있지만, 교육기회의 균등 또는 문화적 환경과 보충학습 기회의 제공 등과 같은 문제 때문일 수도 있다(Linn & Harnisch, 1981; Doolittle, 1984; Lehman, 1986; Doolittle & Cleary, 1987; Muthen, Kao & Burstein, 1988; Kim Sukwoo, 1991; Kim Sukwoo & Park Haejin, 1994; Kim Shin-young, 2001). 따라서 성차에 관한 연구에서 성별 집단에 따라 문항이 차별적으로 기능하는지 아닌지를 파악하는 것은 매우 중요하다.
차별적으로 기능하는 문항이란?  검사가 측정하고자 하는 바를 어느 특정 집단으로 치우침 없이 제대로 측정하고 있는가를 확인하는 것은 편파성 연구로, 이는 문항이 남성과 여성 집단 중 어느 특정집단에게 특히 어렵거나 쉽게 여겨진다면 그 문항은 편파적인 문항 또는 차별적으로 기능하는 문항이라고 할 수 있다. 차별적으로 기능하는 문항이란 인간의 잠재적 특성을 측정하는 검사 문항들이 능력이 같음에도 불구하고 집단의 특성 때문에 어떤 집단에서는 쉬운 문항으로 다른 집단에서는 어려운 문항으로 기능하는 것을 말한다(Kim Sukwoo, 1991; Kim Sukwoo-Park Haejin, 1994).
성별에 따라 교과별 성취도 차이가 나타나는 이유에는 어떤 주장들이 있는가? 성별에 따른 영역별 성취도의 차이가 나타나는 이유에 대한 연구는 다양하게 이루어져 왔다. 우선 교과별 성취도에 있어서 성차에 대한 생물학적 접근은 남성이 논리적인 연산과 관련된 좌뇌가 발달하고 여성이 언어와 관련된 우뇌가 발달하여 여성이 남성에 비하여 언어와 외국어 영역에서 높은 성취도를 보인다는 것이다. 또 다른 관점에서 수업 시간에 교사로부터 남학생과 여학생이 다른 대우를 받기 때문이라는 주장도 있다. 또한 시험 문제가 어느 한 집단에게 유리하게 출제되었다는 주장이 있다.
참고문헌 (58)

  1. Ahn, Chang-kyu & Cha, Kyung-Ok(1984). A Comparison of Four Statistical Procedures for Detecting Test Item-Bias. Social Survey Research, 3, 29-49. 

  2. Angoff, W. H.(1982) Use of item difficulty and discriminant indices for detecting item bias. ed. by Berk, R. A. In Handbook of method for detecting test bias, 96-116. Baltimore, London: The Johns Hopkins University Press, 

  3. Angoff, W. H. & Ford, S. F.(1973). Item-race interaction on a test of scholastic aptitude. Journal of Educational Measurement, 10(2), 95-106 

  4. Baker, F. B., & Al-Karni, A.(1991). EQUATE: Computer program for equating two metrics in item response theory [Computer program]. Madison WI: University of Wisconsin, Laboratory of Experimental Design. 

  5. Camilli, G.(1979). A critique of the chi-square method assessing item bias. Unpublished paper, Laboratory of Education Research, University of Colorado at Boulder. 

  6. Chin, Sujung & Seong, Tae-je(2004). An Exploratory Study on Item-format Related DIF with MH and SIBTEST techniques. Journal of Educational Evaluation, 17(2), 215-236. 

  7. Choo, Jeong-A & Seong, Tae-je(1993). Detecting gender differently functioned items of the 4th and 5th tryouts of College Scholastic Ability Test by Mantel-Haeszel and Raju Methods. Journal of Educational Evaluation, 6(2), 259-286. 

  8. Choo, Jeong-A.(1993). Detecting gender differently functioned items of the tryouts of College Scholastic Ability Test. Master's Thesis, Ehwa Womans University, Seoul. 

  9. Cleary, T. A. & Hilton, T. L.(1968). An Investigation of Item Bias. Educational and Psychological Measurement, 28, 61-75. 

  10. Cook, L. L..Dorans, N. J. & Eignor, D. R.(1988). An assessment of the dimensionality of three SAT-Verbal test editions. Journal of Educational Statistics, 13, 19-43. 

  11. Doolittle, A. E.(1984). Interpretation of differential item performance accompanied by gender differences in academic background. Paper presented at the annual meeting of the American Educational Research Association, New Orleans. 

  12. Doolittle, A. E. & Cleary, T. A.(1987). Gender-based differential item performance in mathematics achievement items. Journal of Educational Measurement, 24(2), 157-166 

  13. Educational Research Institute of Seoul National University(1998). The encyclopedia of education. Seoul: Hawoo. 

  14. Faggen-Steckler, J..K. A. McCarthy, & C. K. Tittle(1974). A quantitative method for measuring sex bias in standardized test. Journal of Educational Measurement, 11, 151-161. 

  15. Greaud, V. A.(1987). Investigation of the unidimensionality assumption of item response theory. Master's Thesis, The Johns Hopkins University, Baltimore, Maryland. 

  16. Haley, D. C.(1952). Estimation of the dosage ,ortality relationship when the dose is subject to error(Technical Report No. 15). Stanford CA: Stanford University, Applied Mathematics and Statistics Laboratory. 

  17. Hambleton, R. K. & Swaminathan, H.(1985). Item responsw theory : Principles and application. Boston: Kluwer Boston 

  18. Hambleton, R. K.(1989). Principles and selected applications of item response theory. In R. L. Linn (ed.), Educational measurement(3rd ed., pp. 147-200). New York: MacMillan 

  19. Hambleton, R. K..Swaminathan, H. & Rogers, H. J.(1991). Fundmentals of item response theory. CA: SAGE Publications. 

  20. Hambleton, R. K..Swaminathan, H., & Rogers, J. H.(1991). Fundamentals of item response theory. Newbury Park, CA: Sage. 

  21. Hanson, B. A.(1988). Uniform DIF and DIF defined by differences in item response function. Journal of Educational and Behavioral Statistics, 23(3), 244-253. 

  22. Harnish, D. L.(1994). Performance assessment in review : New direction for assessment student understanding. International Journal of Educational Research, 21(3), 341-350 

  23. Hatti, J. A.(1984). An empirical study of various indices for determining unidimensionality. Multivariate Behavioral Research, 19, 49-78. 

  24. Holland, P. W. & Thayer, D. T.(1988) Differential item performance and the Mentel-Haenszel procedure. In H. Wainer & H, I, Braun(Eds.). Test validity(pp. 129-145). Hillsdale, NJ: Lawrence Erlbaum. 

  25. Holweger, N. & Weston, T.(1998). Differential item functioning: an applied comparison of the item characteristic curve method with the logistic discriminant function method. (ERIC Document Reproduction Service No. ED 422362) 

  26. Jensen, A. R.(1969). How much can we boost IQ and Scholistic achievement?. Harvard Educational Review, 39, 81-83. 

  27. Kim, S. H. & Cohen, A. S.(1991a). IRTDIF: A comparision of two area measures for detecting differential item function. Applied Psychological Measurement, 15, 269-278. 

  28. Kim, S. H. & Cohen, A. S.(1991b). IRTDIF: A computer program for IRT differential item functioning[Computer program]. Madison WI: University of Wisconsin. 

  29. Kim, Shin-young(1993). An Empirical Study for Validity of Mantel-Haenszel Method. Journal of Educational Evaluation, 6(1), 59-90. 

  30. Kim, Shin-young(2001). Methods of Analyzing Differently functioned items. Seoul: kyoyookkwahaksa. 

  31. Kim, Sukwoo.(1991). Gender and OTL effects on mathematics achievement for U.S. SIMS 12th grade students. Journal of Educational Evaluation, 4, 32-58. 

  32. Kim, Sukwoo. & Park, Haejin.(1994). A Study of Differential Item Functioning based on Gender and Major. Journal of Pedagogy in Pusan, 7, 45-64. 

  33. Ko, Jung Hwa.Do, Jong Hoon, & Song, Miyoung.(2008). An Analysis of the Gender Difference in National Assessment of Educational Achievement of Mathematics. The Journal of Educational Research in Mathematics, 18(2), 179-200. 

  34. Lee, Dae Sik & Kim, Su Mi.(2003). Elementary School Students' and Teachers' Responses on Sex Differences in Mathematics Learning. The Journal of Elementary Education, 16(1), 297-315. 

  35. Lee, Myung-Ae(2010). DIF Identification via Hierarchical Nonlinear Model. Journal of Educational Evaluation, 23(1), 171-190. 

  36. Lee. Young(2002). Detecting Differential Item Functioning based on Gender and Major : Verbal Area in the tryout of College Scholastic Ability Test. Master's Thesis, Pusan National University, Busan. 

  37. Lehman, J. D.(1986). Opportunity to learn and differential item functioning. Unpublished doctoral dissertation, University of Valifornia, Los Angeles. 

  38. Linn, R. L. & Harnish, D. L.(1981) Interactions between item content and group membership on achievement test items. Journal of Educational Measurement, 18, 109-118. 

  39. Lord, F. M.(1980). Applications of item response theory to practical testing problems. Hilldale, NJ: Lawrence Erlbaum. 

  40. Lord, F. M. & Novick, M. R.(1968). Statistic theories of mental test scores. Reading, MA: Addison-Wesley. 

  41. Mellenbergh, G. J.(1982). Contingency table models for assessing item bias. Journal of Educational Statistics, 7, 105-108. 

  42. Mislevy, R. J. & Bock, R. D.(1990). BILOG 3 for windows: Item analysis and test scoring with binary logistic models[Computer program]. Mooresville IN: Scientific Software Inc. 

  43. Muthen, B..Kao, C.-F. & Burstein, L.(1988). Instructional sensitivity in mathematics achievement test item: Application of a new IRT-based detection technique. Forthcoming in Journal of Educational Measurement. 

  44. Muthen, B. O. & Muthen, L. K.(2001). Mplus: Statistical analysis with latent variables[Computer program and manual]. Los Angeles: Statmodel. 

  45. Noh, Un-Kyung(2007). Detecting Gender-related Differential Item Functioning on the Spatial Ability Test in the Aptitude Battery for Middle School Student. Master's Thesis, Ehwa Womans University, Seoul. 

  46. Peterson, N. S..Kolen, M. S. & Hoover, H. D.(1989). Scaling, norming and equating. In Educational Measurement(3rd). Ed by Linn, R. L.. New York: Macmillian Publishing Company. 

  47. Potenza, M. T. & Dorans, N. J.(1995). DIF Assessment for Polytomously Scored Item: A Framework for Classification and Evaluation. Applied Psychological Measurement, 19(1), 23-37. 

  48. Raju, N. S.(1988). The area between item characteristic curves. Psychometrika, 53, 495-502. 

  49. Roussos, L. A. & Stout, W. F.(1996). Simulation studies of the effects of small sample size and studied item parameters on SIBTEST and Mantel-Haenszel type I error performance. Journal of Educational Measurement, 32(2), 215-230. 

  50. Runder, L. M.(1977). An evaluation of select approaches for biased item identification. Unpublished doctoral dissertation. Catholic University of America, 18-27. 

  51. Scheuneman, J. D.(1975). A new method of assessing bias in test items. Paper presented at annual meeting of American Educatioal Research Association. Washington D. C.. 

  52. Seong, Tae-je(1993). A Comparative Study between Raju and Mantel-Haeszel Methods for Detecting Differential Item Function. Journal of Educational Evaluation, 6(1), 91-120. 

  53. Shealy, R. T. & Stout, W. F.(1993). An Item Response Model for Test Bias and Differential Test Functioning. Hillsdale, NJ: Erlbaum. 

  54. Song, Miyoung(2001). Detection of gender-related DIF and comparison of DIF procedures in a performance assessment. doctoral Thesis, Ehwa Womans University, Seoul. 

  55. Stocking, M. L. & Lord, F. M.(1983). Developing a common metric in item response theory. Applied Psychological Measurement, 7, 201-210. 

  56. Stout, W.(1987). A nonparametric approach for assessing latent trait unidimensionality. Psychometrika, 52, 589-617. 

  57. Swaminathan, H. & Rogers, H. J.(1990). Detecting differential item functioning using logistic regression procedures. Journal of Educational Measurement, 27, 361-370. 

  58. Williams, R. L.(1971). Abuse and misuse of testing black children. The Counseling Psychologists, 2, 62-73 

