제주마 집단의 혈연 정보량과 정보 오류가 유전 모수 추정치에 미치는 영향 Influence of Amount of Pedigree Information and Parental Misidentification of Progeny on Estimates of Genetic Parameters in Jeju Race Horses원문보기
제주마 경주 능력 개량을 위한 기초 자료 확보를 위하여 혈통 정보량과 오류량이 유전 모수 추정에 미치는 영향을 분석하였다. 혈통 자료는 램덤으로 혈통 정보의 삭제(0~25%) 또는 오류 유발(0~25%)과 각 수준별 20회 반복으로 모의자료를 형성하였다. 분석에 이용된 형질은 제주마 1,000m 경주의 주파 시간을 이용하였고, 상가적 유전 분산의 추정은 DF-REMLAI 알고리즘을 이용하였다. 개체의 양부모에 대한 정보 유실량과 오류량의 증가는 선형적인 회귀관계로 상가적 유전 분산 성분(유실 b = -0.079, 오류 b= -0.114)과 유전력 추정치(유실, b= -0.006; 오류, b = 0.008)의 감소를 초래했다(p<0.01). 특히 개체의 양부모에 대한 정보유실보다는 정보 오류가 상가적 유전분산량과 유전력 추정치를 보다 크게 왜곡하는 것으로 나타났다. 부 또는 모에 대한 정보의 유실과 오류의 증가도 대부분 오차 분산 성분과 영구 환경 분산 성분의 증가를 유발시키고, 상가적 유전 분산성분의 감소를 가져왔다. 원자료에서 얻은 모수를 기준으로 했을 때 양부모에 대한 정보의 유실량과 오류량이 1% 증가함에 따라 유전력은 각각 0.92% 및 1.39%씩 낮아지는 관계를 보였다 (p<0.01). 제주마의 1,000m 주파 속도에 대한 유전력은 0.60으로 추정되었지만, 초기 집단에 존재하는 혈통 정보의 누락 및 오류를 고려한다면 실제보다도 10% 정도는 낮게 추정되고 있다고 사료되었다. 이와 같은 결과는 상가적 유전 분산량의 감소는 물론, 선발에 따른 제주마의 경주 능력에 대한 유전적 개량량에도 영향을 줄 것으로 판단된다.
제주마 경주 능력 개량을 위한 기초 자료 확보를 위하여 혈통 정보량과 오류량이 유전 모수 추정에 미치는 영향을 분석하였다. 혈통 자료는 램덤으로 혈통 정보의 삭제(0~25%) 또는 오류 유발(0~25%)과 각 수준별 20회 반복으로 모의자료를 형성하였다. 분석에 이용된 형질은 제주마 1,000m 경주의 주파 시간을 이용하였고, 상가적 유전 분산의 추정은 DF-REMLAI 알고리즘을 이용하였다. 개체의 양부모에 대한 정보 유실량과 오류량의 증가는 선형적인 회귀관계로 상가적 유전 분산 성분(유실 b = -0.079, 오류 b= -0.114)과 유전력 추정치(유실, b= -0.006; 오류, b = 0.008)의 감소를 초래했다(p<0.01). 특히 개체의 양부모에 대한 정보유실보다는 정보 오류가 상가적 유전분산량과 유전력 추정치를 보다 크게 왜곡하는 것으로 나타났다. 부 또는 모에 대한 정보의 유실과 오류의 증가도 대부분 오차 분산 성분과 영구 환경 분산 성분의 증가를 유발시키고, 상가적 유전 분산성분의 감소를 가져왔다. 원자료에서 얻은 모수를 기준으로 했을 때 양부모에 대한 정보의 유실량과 오류량이 1% 증가함에 따라 유전력은 각각 0.92% 및 1.39%씩 낮아지는 관계를 보였다 (p<0.01). 제주마의 1,000m 주파 속도에 대한 유전력은 0.60으로 추정되었지만, 초기 집단에 존재하는 혈통 정보의 누락 및 오류를 고려한다면 실제보다도 10% 정도는 낮게 추정되고 있다고 사료되었다. 이와 같은 결과는 상가적 유전 분산량의 감소는 물론, 선발에 따른 제주마의 경주 능력에 대한 유전적 개량량에도 영향을 줄 것으로 판단된다.
The pedigree information and race records of 1,000 m finishing time of Jeju race horses at KRA were used to study the effect of amount of pedigree information and parental misidentification on the estimates of genetic parameters. The modified data sets were made at the range of 2.5 to 25% parental m...
The pedigree information and race records of 1,000 m finishing time of Jeju race horses at KRA were used to study the effect of amount of pedigree information and parental misidentification on the estimates of genetic parameters. The modified data sets were made at the range of 2.5 to 25% parental misidentifications or loss of parental information of individuals with an increment of 2.5 percent. For each incremental level, 20 randomly replicated data sets were obtained and analyzed by single-trait analysis with a DF-REML(AI) algorithm. As the rate of misidentification increased or the amount of pedigree information decreased, the estimates of fraction of additive genetics variance component gradually decreased almost linearly (p<0.05), while the estimated fractions of error variance and permanent environmental variance components gradually increased for the finishing time. Regression coefficients of the percentage amount of both parents' information loss and incorrect pedigree information on additive genetic variances were -0.079 and -0.114, respectively (p<0.01). The estimate of heritability decreased by 0.92% for one percent loss of both parents' information and 1.39% for one percent increase of both parental misidentifications of progeny (p<0.01). For the consideration of probable incorrect and missing parent information of progeny in this early population of Jeju horses, the estimates of additive genetic parameters would be biased downward about ten percent. This results indicate that the amount of pedigree information loss and misidentification of progeny would severely affect estimates of genetic parameters and would reduce genetic gains for selection in Jeju horse population.
The pedigree information and race records of 1,000 m finishing time of Jeju race horses at KRA were used to study the effect of amount of pedigree information and parental misidentification on the estimates of genetic parameters. The modified data sets were made at the range of 2.5 to 25% parental misidentifications or loss of parental information of individuals with an increment of 2.5 percent. For each incremental level, 20 randomly replicated data sets were obtained and analyzed by single-trait analysis with a DF-REML(AI) algorithm. As the rate of misidentification increased or the amount of pedigree information decreased, the estimates of fraction of additive genetics variance component gradually decreased almost linearly (p<0.05), while the estimated fractions of error variance and permanent environmental variance components gradually increased for the finishing time. Regression coefficients of the percentage amount of both parents' information loss and incorrect pedigree information on additive genetic variances were -0.079 and -0.114, respectively (p<0.01). The estimate of heritability decreased by 0.92% for one percent loss of both parents' information and 1.39% for one percent increase of both parental misidentifications of progeny (p<0.01). For the consideration of probable incorrect and missing parent information of progeny in this early population of Jeju horses, the estimates of additive genetic parameters would be biased downward about ten percent. This results indicate that the amount of pedigree information loss and misidentification of progeny would severely affect estimates of genetic parameters and would reduce genetic gains for selection in Jeju horse population.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구는 등록 관리되고 있는 제주마 집단에서 제주마의 유전적 평가를 위한 기초 연구로 혈통 정보의 유실 정도와 오류량이 유전 분산 등 유전 모수의 추정에 미치는 영향을 분석하였다.
가설 설정
pe는 N(0, σPE2I)인 분포, e는 N(0, σE2I)의 분포로 가정하였다.
제안 방법
자료의 구성은 Fortran 램덤 함수를 이용하여 혈통 자료에서 0∼25%까지 2.5%의 등간 간격(0, 2.5, 5.0, 7.5, 10.0, 12.5, 15.0, 17.5, 20.0, 22.5, 25%)으로 혈통 정보를 삭제하면서 33개 유형의 모의 혈통 자료(부모 정보 동시 유실 유형 11개, 아비 정보 유실 유형 11개, 어미 정보 유실 유형 11개)를 구성하였다.
제주마 경주 능력 개량을 위한 기초 자료 확보를 위하여 혈통 정보량과 오류량이 유전 모수 추정에 미치는 영향을 분석하였다. 혈통 자료는 램덤으로 혈통 정보의 삭제(0∼25%) 또는 오류 유발(0∼25%)과 각 수준별 20회 반복으로 모의자료를 형성하였다.
혈통 자료는 램덤으로 혈통 정보의 삭제(0∼25%) 또는 오류 유발(0∼25%)과 각 수준별 20회 반복으로 모의자료를 형성하였다.
혈통 정보의 오류량이 모수 추정치에 영향에 대한 분석도 마찬가지로 0∼25%까지 2.5%의 등간 간격으로 모의 혈통 자료들을 구성하였는데, 개체의 생년월일을 기준으로 하여 동일년도에 태어나 이웃하고 있는 개체들 사이에 서로 램덤으로 교환되는 방법으로 33개의 유형(부모 혈통이 동시 뒤바뀐 유형 11개, 아비 정보 바뀐 유형 11개, 어미 정보 바뀐 유형 11개)의 모의 자료를 구성하였다.
혈통 정보의 유실량이 모수 추정치에 영향을 관찰하기 위해서 혈통원부의 자료를 이용하여 다양한 유형의 모의 자료를 구성하였다. 자료의 구성은 Fortran 램덤 함수를 이용하여 혈통 자료에서 0∼25%까지 2.
대상 데이터
수집된 기록 중 경주로 상태는 함수율에 따라 건조(1∼5%), 양호(6∼9%), 다습(10∼14%), 포화(15∼19%), 불량(20% 이상)으로 구분하였으며, 부담 중량은 경주 조건, 과거 성적, 최근 성적 흐름, 출전 등록마 간 능력 차이 등을 고려하여 한국마사회 핸디캡 위원에서 결정한 중량을 분석에 이용하였다.
제주특별자치도에서 혈통 관리되는 제주마 1,763두(수컷 773두, 암컷 990두)의 개체의 혈통 기록과 제주경마공원의 1,000 m 경주 기록을 수집하여 분석에 이용하였다. 수집된 기록 중 경주로 상태는 함수율에 따라 건조(1∼5%), 양호(6∼9%), 다습(10∼14%), 포화(15∼19%), 불량(20% 이상)으로 구분하였으며, 부담 중량은 경주 조건, 과거 성적, 최근 성적 흐름, 출전 등록마 간 능력 차이 등을 고려하여 한국마사회 핸디캡 위원에서 결정한 중량을 분석에 이용하였다.
데이터처리
정보유실 또는 오류에 대한 영향은 각각의 유형에서 다시 20회 반복으로 램덤 자료를 재구성하면서 모수를 추정한 후, 20회 반복의 모수 추정치들의 평균을 중심점으로 하여 혈통 정보의 변동에 따른 유전 모수 추정치의 변화량에 대한 회귀 분석을 수행하였다.
이론/모형
분산 성분과 유전 모수의 추정은 1,000 m 경주의 주파속도에 영향을 미치는 연도, 나이, 성별, 계절, 경주로의 상태를 고정 효과로 하였고, 부담 중량의 공변량과 임의 효과인 영구 환경 효과와 상가적 유전 효과를 모형에 포함하여 WOMBAT(Meyer K., 2010) 프로그램을 이용하여 DF-REML-AI 알고리즘으로 추정하였다. 통계적 모형은 아래와 같다.
혈통 자료는 램덤으로 혈통 정보의 삭제(0∼25%) 또는 오류 유발(0∼25%)과 각 수준별 20회 반복으로 모의자료를 형성하였다. 분석에 이용된 형질은 제주마 1,000m 경주의 주파 시간을 이용하였고, 상가적 유전 분산의 추정은 DF-REMLAI 알고리즘을 이용하였다.
성능/효과
개체의 부모 정보 가운데 아비에 대한 정보만 점증적으로 소실시킨 경우에는 오차 분산 성분은 증가하는 경향을 보였지만, 영구 환경 분산 성분은 감소하는 경향을 보였고(p<0.05), 상가적 유전 분산 성분의 양은 감소하는 경향을 보였으나(p0.05)은 나타나지 않았다(Table 2).
개체의 부모 정보를 램덤 함수에 의해서 의도적으로 소실시킨 자료를 이용한 분석에서는 부모 정보의 소실량의 증가됨(0∼25%)에 따라, 전체 분산 성분은 변화가 거의 없었으나, 오차 분산 성분과 영구 환경 분산 성분은 증가하는 경향을 보여주고 있었고(p<0.01), 상가적 유전 분산 성분은 뚜렷하게 감소(p<0.01)하는 경향으로 나타났다(Table 1).
개체의 부모에 대한 정보 오류량이 증가함에 따라 유전력 추정치도 선형적으로(b = —0.008 ± 0.001, p<0.01) 뚜렷하게 감소되는 것으로 나타났다(Table 4).
개체의 부모에 대한 혈통 정보의 오류가 1% 증가됨에 따라 유전력 추정치는 1.39%씩 낮아지는 반응을 보이고 있었다(p<0.01).
개체의 양부모에 대한 정보 유실량과 오류량의 증가는 선형적인 회귀관계로 상가적 유전 분산 성분(유실 b = —0.079, 오류 b=—0.114)과 유전력 추정치(유실, b=—0.006; 오류, b = 0.008)의 감소를 초래했다(p<0.01).
05)은 나타나지 않았다(Table 2). 개체의 어미에 대한 정보를 점증적으로 유실시킨 자료로부터 얻은 모수 추정치들은 부모 정보가 동시에 소실된 자료에서 얻은 결과와 유사한 경향으로 상가적 유전 분산과 유전력 추정치의 선형적 감소를 확인할 수 있었다(Table 3). 어미 정보 유실량 증가에 따른 오차 분산 성분의 선형적 변화에 대한 유의성은 없었다(p>0.
8%)였다. 경주 기록 보유 개체는 224두(12.7%)였으며, 1,000 m 경주 기록 수는 1,865개로 경주마 개체 당 평균 8.3개의 기록을 보유하고 있었다.
본 연구에서 개체의 부모에 대한 혈통 정보의 유실량과 오류량은 모두 상당한 정도의 상가적 유전 분산량을 감소시키는 것을 확인해 주고 있었다. 특히 자손의 부모에 대한 정보 유실보다는 정보의 오류가 상가적 유전분산량과 유전력 추정치를 보다 낮게 왜곡하는 것으로 나타나서, 유전 모수 추정을 위한 분석에 앞서 미기록 혈통 정보의 추가적 확보보다는 기록된 정보의 오류를 여러 가지 방법으로 재확인하는 것이 바람직하다고 생각되었다(Table1, Table4).
본 연구에서 개체의 아비 또는 어미에 대한 정보의 유실량과 오류량 정도가 유전 모수 추정치에 대한 영향력은 앞서 보고한 연구자들(Van Vleck, 1970; Geldermann 등, 1986; Israel과 Weller, 2000; Senneke 등, 2004; Sanders 등, 2006)의 결과와 매우 유사한 형태로 오차 분산 성분과 영구 환경 분산 성분의 증가를 유발시키고, 상가적 유전 분산 성분의 감소를 가져오는 것을 확인해 주고 있었다. 원본의 혈통 자료에서 얻은 모수를 기준으로 했을 때, 개체의 부모 정보 동시 유실량과 오류량의 증가는 유전력 추정치를 선형적 부(유실량 : b = —0.
어미에 대한 정보의 오류량이 점진적으로 증가함에 따라 유전력 추정치도 선형적으로 감소(b = —0.006 ± 0.000, p<0.01)하는 현상을 뚜렷하게 보여주고 있었다(p<0.01).
원자료에서 얻은 모수를 기준으로 했을 때 양부모에 대한 정보의 유실량과 오류량이 1% 증가함에 따라 유전력은 각각 0.92% 및 1.39%씩 낮아지는 관계를 보였다 (p<0.01).
이에 따라 추정된 분산 성분에 의한 유전력 추정치도 혈통 정보 소실 비율이 증가함에 따라 선형적(b = —0.006 ± 0.000, p<0.01)으로 낮아지는 경향을 보였다.
이웃하는 개체들 사이에 무작위로 부모에 대한 정보가 동시에 교환된 자료에서는 정보 오류가 점증적으로 증가(0∼25%)됨에 따라 오차 분산 성분과 영구 환경 분산 성분은 증가를 보였으며(p<0.01), 전체 분산 성분과 상가적 유전분 산성 분석(p<0.01)은 뚜렷하게 감소하는 경향을 보였다(p<0.01).
이는 후대 검정 효율과 육종가의 예측에도 실질적으로 영향하고 있음을 말해주고 있다. 제주마 집단에서 어미의 정보가 아비의 정보보다 유전 모수 추정에 더 많은 영향을 주는 것으로 분석되었는데, 이는 번식계절에 극소수의 종모마를 이용하여 번식시키는 제주마 초기 집단의 특이적인 번식 형태가 영향을 미친 것으로 생각된다(종마 두당 평균 34.1두의 자마 생산). 또한 어미에 대한 정보 오류는 자마의 자연 포유 관계의 형성으로 현실적으로 그리 크게 발생하지는 않을 것으로 생각된다.
제주마의 1,000m 주파 속도에 대한 유전력은 0.60으로 추정되었지만, 초기 집단에 존재하는 혈통 정보의 누락 및 오류를 고려한다면 실제보다도 10% 정도는 낮게 추정되고 있다고 사료되었다. 이와 같은 결과는 상가적 유전 분산량의 감소는 물론, 선발에 따른 제주마의 경주 능력에 대한 유전적 개량량에도 영향을 줄 것으로 판단된다.
01). 추정된 유전력은 어미의 정보 오류량이 1%가 증가됨에 따라 1.04% 감소하는 반응을 보였다(Table 6).
01). 특히 개체의 양부모에 대한 정보유실보다는 정보 오류가 상가적 유전분산량과 유전력 추정치를 보다 크게 왜곡하는 것으로 나타났다. 부 또는 모에 대한 정보의 유실과 오류의 증가도 대부분 오차 분산 성분과 영구 환경 분산 성분의 증가를 유발시키고, 상가적 유전 분산 성분의 감소를 가져왔다.
본 연구에서 개체의 부모에 대한 혈통 정보의 유실량과 오류량은 모두 상당한 정도의 상가적 유전 분산량을 감소시키는 것을 확인해 주고 있었다. 특히 자손의 부모에 대한 정보 유실보다는 정보의 오류가 상가적 유전분산량과 유전력 추정치를 보다 낮게 왜곡하는 것으로 나타나서, 유전 모수 추정을 위한 분석에 앞서 미기록 혈통 정보의 추가적 확보보다는 기록된 정보의 오류를 여러 가지 방법으로 재확인하는 것이 바람직하다고 생각되었다(Table1, Table4).
후속연구
끝으로 유전 능력 평가에 혈통 정보의 확보량과 오류량에 따른 왜곡현상의 배제를 위해서는 혈통에 대한 최대의 정보수집과 다양한 방법으로 혈통 진위에 대한 확인 점검이 필수적이라 생각되며, 참값에 보다 근접할 수 있는 유전 모수 추정을 위해서는 제주마 집단뿐만, 아니라, 유전 모수를 추정하려는 모든 소규모 가축 집단에서는 추가적인 혈통 정보의 확보와 오류 확인에 대한 노력이 필요하다고 사료된다.
질의응답
핵심어
질문
논문에서 추출한 답변
집단에서, 아비에 대한 정보 오류가 문제되는 이유는?
Senneke 등(2004)과 Sanders 등(2006)은 헤어포드 품종 집단과 Angeln 젖소 집단에서 아비에 대한 정보 오류가 생시 체중과 이유시 체중에 대한 유전 모수 추정치에 영향을 보고한바 있다. 특히 Sander 등(2006)은 종모우당 자손수가 적거나, 유전력이 낮은 형질의 경우에는 아비에 대한 정보의 유실 또는 정보의 오류는 선발에 따른 유전적 개량량에도 심각한 영향을 미친다고 하였다. Van Vleck(1970)은 부가계로 구성된 암소 집단에서 개체의 아비에 대한 정보 오류는 형질의 유전력을 감소시키고, 정확한 유효 정보의 비율(p)을 기준으로 한다고 하면, 유전력 추정치의 감소율은 대략 (1—p2)에 이른다고 요약한 바 있다.
집단을 구성하는 개체들의 혈연관계에 대한 정보는 어떻게 이용되고 있나?
집단을 구성하는 개체들의 혈연관계에 대한 정보는 가축의 유전 능력 평가에 필수적 기초 자료로 이용되고 있다. 개체 육종가(B.
유전 능력 평가를 보다 정확하게 하기 위한 방법은?
오랜 기간 폐쇄된 소규모 가축 집단에서는 부모 및 조상의 혈통 정보에 대한 기록이 없을지라도, 집단을 구성하고 있는 개체들 사이에는 다양한 정도의 혈연관계가 있을 것이라는 추측은 당연하다. 최근에는 보다 정확한 유전 능력 평가를 위해서 유실된 혈연 정보를 최대로 수집하고, 정보의 오류를 교정하기 위하여 분자유전학적인 기법이 사용되기도 한다. 또한, 정확한 유전 능력 평가를 위한 노력의 하나로 혈연관계를 나타내는 상가적 행렬 계수의 구성을 DNA 표지나 SNP 좌위를 이용한 분자유전학적인 방법으로 접근하는 방법이 보고된 바도 있다(Wilson 등, 2003; Hay와 Goddard, 2008).
참고문헌 (11)
Geldermann H, Pieper U and Weber WE. 1986. Effect of misidentification on the estimation of breeding value and heritability in cattle. J. Anim. Sci. 63:1759-1768.
Isreal C and Weller JI. 2000. Effect of misidentification on genetic gain and estimation of breeding value in dairy cattle population. J. Dairy Sci. 83:181-187.
Meyer K. 2010. WOMBAT, Animal Genetics and Breeding Unit, University of New England, Armidale, NSW 2351, Australia.
Saberivand A, Javanmard A and Safdari M. 2011. Parentage verification and identity test of Ghezel sheep using microsatillate markers. African Journal of Biotechnology 10 (31): 5815-5819.
Sanders K, Bennewitz J and Kalm E. 2006. Wrong and missing sire information affects genetic gain in the Angeln dairy cattle population. J. Dairy Sci. 89:315-321.
Senneke SL, MacNeil MD and Van Vleck LD. 2004. Effect of sire misidentification on estimates of genetic parameters for birth and weaning weights in Hereford cattle. J. Anim. Sci. 2004. 80:2307-2312.
Visscher PM, Woolliams JA, Smith D and Williams JL. 2002. Estimation of pedigree errors in the UK dairy population using microsatellite markers and the impact on selection. J.Dairy Sci. 85:2368-2375.
Wilson AJ, McDonald G, Moghadam HK, Herbinger CM and Ferguson MM. 2003. Marker-assisted estimation of quantitative genetic parameters in rainbow trout, Oncorhynchus mykiss. Genet. Res. 81:145-156.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.