개인 식품섭취 선호도에 따른 만성질환 발생 위험도 분석 시스템 설계 및 구현 Design and Implementation of Chronic Disease Risk Analysis System according to Personalized Food Intake Preferences원문보기
IT 기술의 발달로 인터넷에 다양한 콘텐츠가 늘고, 다양한 정보에서 개인의 적합한 정보를 제공받고자 하는 요구가 급증하면서 다양한 개인화 서비스를 제공 방법에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 구매 선호도에 따른 상품 추천시스템의 분석방법을 개인 식품섭취 선호도에 따른 고혈압 및 당뇨 발생위험도를 분석하는 시스템에 적용하는 방법을 제안하고자 한다. 개인의 식품섭취 선호도 분석을 위해, 피어슨 상관계수를 이용하여 참조데이터와 샘플데이터의 유사도 가중치를 계산하고, 개인과의 유사도에 따른 집단을 구성하여 고혈압과 당뇨의 발생 위험도를 산출한다. 시스템의 유의성 검정을 위해 1,021명의 샘플을 시스템에 적용하였다. 고혈압과 당뇨병의 유병군에서 정상인군에 비해 더 높은 발생 위험도가 산출되는 통계적으로 유의한 경향을 확인할 수 있어 식품섭취 선호도와 고혈압/ 당뇨의 발생 위험도의 관련성이 있음을 확인하였다. 본 연구에서는 개인의 식품섭취 선호도에 따른 고혈압 및 당뇨 발생 위험도 분석 시스템의 유효성을 검증하였다.
IT 기술의 발달로 인터넷에 다양한 콘텐츠가 늘고, 다양한 정보에서 개인의 적합한 정보를 제공받고자 하는 요구가 급증하면서 다양한 개인화 서비스를 제공 방법에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 구매 선호도에 따른 상품 추천시스템의 분석방법을 개인 식품섭취 선호도에 따른 고혈압 및 당뇨 발생위험도를 분석하는 시스템에 적용하는 방법을 제안하고자 한다. 개인의 식품섭취 선호도 분석을 위해, 피어슨 상관계수를 이용하여 참조데이터와 샘플데이터의 유사도 가중치를 계산하고, 개인과의 유사도에 따른 집단을 구성하여 고혈압과 당뇨의 발생 위험도를 산출한다. 시스템의 유의성 검정을 위해 1,021명의 샘플을 시스템에 적용하였다. 고혈압과 당뇨병의 유병군에서 정상인군에 비해 더 높은 발생 위험도가 산출되는 통계적으로 유의한 경향을 확인할 수 있어 식품섭취 선호도와 고혈압/ 당뇨의 발생 위험도의 관련성이 있음을 확인하였다. 본 연구에서는 개인의 식품섭취 선호도에 따른 고혈압 및 당뇨 발생 위험도 분석 시스템의 유효성을 검증하였다.
While variety of content on the internet has increased with the development of IT and person's needs about suitable information are increasing rapidly, studies for personalized service have been actively performed. In the study, we proposed the Hypertension and Diabetes risk analysis system accordin...
While variety of content on the internet has increased with the development of IT and person's needs about suitable information are increasing rapidly, studies for personalized service have been actively performed. In the study, we proposed the Hypertension and Diabetes risk analysis system according to personal food intake preference using the analysis method of buying preferences in product recommendation system. For the analysis of food intake preference, the Pearson correlation coefficient is used to calculate similarity weights between each reference analysis data and sample data and then reference data should be grouping into the similarity weights and calculating risk of hypertension and diabetes each group. To evaluate the significance of this system, 1,021 subjects are applied the system. Hypertension and diabetes groups' risk is significant higher than normal group statistically so, it is confirmed that food intake preference and the diseases were relevant. In this paper, we verify the validity of hypertension and diabetes risk analysis system using a personal food intake preference.
While variety of content on the internet has increased with the development of IT and person's needs about suitable information are increasing rapidly, studies for personalized service have been actively performed. In the study, we proposed the Hypertension and Diabetes risk analysis system according to personal food intake preference using the analysis method of buying preferences in product recommendation system. For the analysis of food intake preference, the Pearson correlation coefficient is used to calculate similarity weights between each reference analysis data and sample data and then reference data should be grouping into the similarity weights and calculating risk of hypertension and diabetes each group. To evaluate the significance of this system, 1,021 subjects are applied the system. Hypertension and diabetes groups' risk is significant higher than normal group statistically so, it is confirmed that food intake preference and the diseases were relevant. In this paper, we verify the validity of hypertension and diabetes risk analysis system using a personal food intake preference.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
1,021명의 샘플데이터를 개인 식품섭취빈도 분석 프로세스에 적용하여 29,406명의 데이터와 유사도 가중치를 산출하여 29,406명과 계산된 유사도가중치 크기에 따라 사분위수로 나누어 4개 집단의 승산비를 계산하였다. 계산된 1,021명의 실제 질병 진단 내역과 비교하여 유병 집단에서의 승산비 평균과 실제 정상인 집단의 승산비 평균을 확인하고자 하였다.
본 연구에서는 개인의 식품섭취 선호도에 따른 당뇨병과 고혈압 발생 위험도를 분석하는 시스템을 제안하였다. 국민건강영양조사 자료로부터 사전 샘플링한 1,021명의 데이터를 이용하여 유의성 검정을 할 샘플을 구성하였다.
이러한 일반화된 건강정보는 건강에 대한 인식 개선은 가능하지만 각 개인의 성향을 분석한 것이 아니므로 실질적인 영향을 미치지 못한다. 본 연구에서는 한국인을 대상으로 조사되어온 국민건강 영양조사 자료를 기반으로 개인의 데이터를 분석하여 개인의 식품섭취 선호도가 고려된 분석을 통해 고혈압과 당뇨의 위험도 평가 시스템을 구현하고자 하였다.
가설 설정
하지만 개인의 식품 섭취의 선호도 분석을 통한 개인화 서비스에 대한 접근은 미비하다. 국민건강영양조사 지침서[5]에서 식생활이 매년 크게 변화하지 않는다는 전제를 고려하여 연구 분석 시 1년간의 섭취양상을 기반으로 조사하고, 건강에 대한 식생활의 영향은 장기간 섭취를 통해 영향을 미치는 것으로 가정한다. 이를 근거로 개인의 식품섭취선호도는 섭취 양상을 내포한 1년간의 식품섭취빈도를 바탕으로 개인의 유사도 가중치를 산정하여 식품섭취 유서성에 따른 집단을 구성하고 집단의 고혈압과 당뇨의 발생 위험도를 평가하여 제시함으로써 통계적 근거를 기반으로 한 정보를 제공하는 시스템을 설계하였다.
제안 방법
유의성 분석를 위한 실험데이터는 국민건강영양조사제 4기와 제5기(2007-2011) 자료에서 참조데이터 구성 전에 미리 샘플링 한 값으로, 연도별 약 200 샘플을 추출하여 1,021명의 샘플데이터를 집합으로 사용하였다. 1,021명의 샘플데이터를 개인 식품섭취빈도 분석 프로세스에 적용하여 29,406명의 데이터와 유사도 가중치를 산출하여 29,406명과 계산된 유사도가중치 크기에 따라 사분위수로 나누어 4개 집단의 승산비를 계산하였다. 계산된 1,021명의 실제 질병 진단 내역과 비교하여 유병 집단에서의 승산비 평균과 실제 정상인 집단의 승산비 평균을 확인하고자 하였다.
과거 모든 데이터와 비교도 가능하고, 최근 통계자료만을 기반으로도 분석할 수 있다. 개인의 식품섭취빈도는 국민건강영양조사에서 사용한 63가지 식품의 1주일 단위의 섭취 횟수로 입력할 수 있도록 하였다.
국민건강영양조사 자료로부터 사전 샘플링한 1,021명의 데이터를 이용하여 유의성 검정을 할 샘플을 구성하였다. 검정 샘플링에서 제외된 29,406명의 데이터의 식품섭취빈도를 기반으로 분석하고자 하는 개인과의 상관관계를 계산하여 유사도 그룹을 사분위수로 구분하고, 그룹별 고혈압과 당뇨병 발생 위험도를 산출하게 된다. 유의성 분석 결과 고혈압과 당뇨병의 실제 유병군에서 정상인군에 비해 더 높은 발생 위험도가 산출되는 통계적으로 유의한 경향을 확인할 수 있어 식품섭취 선호도와 고혈압/ 당뇨의 발생 위험도의 관련성이 있음을 확인하였다.
그러나 분석 사용된 참조데이터의 경우, 조사 시점이 한정되어있는 단층연구로 추적에 의한 자료가 아니라는 한계가 있다. 다년간의 조사 자료를 기반으로 참조분석 데이터를 구성하고, 유의성 분석에 활용한 데이터 역시 5개 연도에서 각각 샘플링하여 분석함으로써 시간적 변화의 영향을 감쇄시키고자 하였다. 향후 본 연구의 결과를 토대로 인구통계학적 정보를 추가 분석하고, 특정 질병에 영향을 미치는 식품의 연구 결과를 추가 하여 가중치를 적용하는 연구가 필요하다.
분석을 위해 업로드 한 참조데이터는 국민건강영양조사 2007~2011년도 자료를 통합하여 사전 테스트를 위한 1,021명의 샘플를 제외한 29,406명을 참조데이터로 구성하였다. 다음의 화면은 참조데이터를 업로드하는 페이지로 분석에 활용될 참조데이터를 추가 업로드 할 수 있는 유연한 구조로 설계하였다. 국민건강영양조사 데이터 추가 발생 시 추가하여 분석에 이용할 수 있다.
식품섭취빈도의 유사성은 상관관계 기반의 알고리즘으로 산출하여 개인과 사용자들의 식품섭취빈도에 대한 공통 선호도 값을 통해 유사도 평가하여 유사 집단을 구성한다. 데이터간의 유사도를 판별하기 위해 사용자와 유사한 식품섭취빈도를 갖는 이웃을 유사도 가중치로 분석한다. 본 논문에서는 유사도 가중치를 계산하기 위하여 피어슨 상관계수를 이용하였다.
이러한 분석방법으로 개인의 식품섭취 선호도에 따른 집단을 구성하고 구성된 집단의 당뇨병 발생 위험도를 분석할 수 있는 모델 연구가 진행되었다[10]. 본 논문에서는 기존의 연구를 통해 식품섭취 선호도에 따른 당뇨병 발생 위험도 평가 모델을 응용하여 고혈압과 당뇨병 발생 위험도를 계산할 수 있도록 프로세스를 수정하였다. 수정된 분석 모델의 프로세스는 그림 1과 같다.
제안된 시스템은 분석에 사용되는 국가 연구조사인 국민건강영양조사를 통해 수집된 최신의 데이터를 업데이트 할 수 있는 모듈, 개인의 식품섭취빈도를 입력할 수 있는 자료입력 모듈, 입력된 자료를 유사도 분석 및 승산비 산출 알고리즘을 이용한 개인 질환 발생 위험도를 예측하는 모듈, 데이터를 저장하는 데이터베이스로 구성되며 산출된 결과를 사용자에게 보여주는 인터페이스 모듈을 포함한다. 본 시스템은 클라이언트/서버 환경의 웹서비스로 JSP(Java Server Page)를 사용하여 구현하였다. 데이터베이스는 MySQL 5.
본 시스템의 참조 데이터는 국민건강 영양조사 원시 자료로부터 수집된 자료를 기반으로 식품섭취빈도와 고혈압, 당뇨병의 유병여부 값을 추출하여 데이터베이스에 업로드 한다. 분석을 위해 업로드 한 참조데이터는 국민건강영양조사 2007~2011년도 자료를 통합하여 사전 테스트를 위한 1,021명의 샘플를 제외한 29,406명을 참조데이터로 구성하였다.
분석 모듈에서 평가하고자 하는 개인의 식품섭취빈도를 입력받아 업로드 되어 있는 참조데이터와 유사도가중치 계산을 통해 상관관계를 추출하고, 상관계수에 따른 유사도 그룹을 산정한다. 그룹별 유병여부를 분석하여 평가하고자 하는 개인과 유사도가 높은 그룹의 승산비와 95% 신뢰구간 결과를 제공한다.
국민건강영양조사 지침서[5]에서 식생활이 매년 크게 변화하지 않는다는 전제를 고려하여 연구 분석 시 1년간의 섭취양상을 기반으로 조사하고, 건강에 대한 식생활의 영향은 장기간 섭취를 통해 영향을 미치는 것으로 가정한다. 이를 근거로 개인의 식품섭취선호도는 섭취 양상을 내포한 1년간의 식품섭취빈도를 바탕으로 개인의 유사도 가중치를 산정하여 식품섭취 유서성에 따른 집단을 구성하고 집단의 고혈압과 당뇨의 발생 위험도를 평가하여 제시함으로써 통계적 근거를 기반으로 한 정보를 제공하는 시스템을 설계하였다.
입력된 개인의 식품섭취빈도는 분석에 적용할 참조 데이터를 선택하여, 선택된 참조데이터 전체 샘플과 개인의 식품섭취빈도의 유사도를 계산한다. 참조 데이터 전체 샘플과 계산된 유사도에 따라 참조 데이터를 사분위수로 나누어 식품섭취빈도를 입력한 개인과 가장 유사한 집단 샘플들의 당뇨 및 고혈압 발생 위험률을 산출한다.
제안된 시스템은 분석에 사용되는 국가 연구조사인 국민건강영양조사를 통해 수집된 최신의 데이터를 업데이트 할 수 있는 모듈, 개인의 식품섭취빈도를 입력할 수 있는 자료입력 모듈, 입력된 자료를 유사도 분석 및 승산비 산출 알고리즘을 이용한 개인 질환 발생 위험도를 예측하는 모듈, 데이터를 저장하는 데이터베이스로 구성되며 산출된 결과를 사용자에게 보여주는 인터페이스 모듈을 포함한다. 본 시스템은 클라이언트/서버 환경의 웹서비스로 JSP(Java Server Page)를 사용하여 구현하였다.
입력된 개인의 식품섭취빈도는 분석에 적용할 참조 데이터를 선택하여, 선택된 참조데이터 전체 샘플과 개인의 식품섭취빈도의 유사도를 계산한다. 참조 데이터 전체 샘플과 계산된 유사도에 따라 참조 데이터를 사분위수로 나누어 식품섭취빈도를 입력한 개인과 가장 유사한 집단 샘플들의 당뇨 및 고혈압 발생 위험률을 산출한다. 산출된 결과는 개인과 비슷한 식품섭취빈도를 가진 대상자들의 당뇨 및 고혈압 유병여부이므로, 개인의 식품섭취와 질병과의 관련성을 파악할 수 있다.
유사도 집단 그룹화는 순위에 따른 사분위수로 그룹화하여 4개의 그룹간의 질병발생위험도를 평가할 수 있다. 피어슨 상관계수의 유사도 가중치 계산은 오차와 표준편차를 이용하게 되어 표본 데이터의 누락이 있는 경우 예측값이 부정확해지는 단점이 있으나[11], 식품섭취빈도 조사자료 특성상 충분한 데이터가 확보되고 희박성 문제에 노출될 가능성이 적어 식품섭취빈도 유사도 가중치 연구에 유리한 이론으로 본 연구에 개인의 식품섭취빈도와 유사도 가중치를 분석하는 방법으로 적용하였다.
대상 데이터
본 연구에서는 개인의 식품섭취 선호도에 따른 당뇨병과 고혈압 발생 위험도를 분석하는 시스템을 제안하였다. 국민건강영양조사 자료로부터 사전 샘플링한 1,021명의 데이터를 이용하여 유의성 검정을 할 샘플을 구성하였다. 검정 샘플링에서 제외된 29,406명의 데이터의 식품섭취빈도를 기반으로 분석하고자 하는 개인과의 상관관계를 계산하여 유사도 그룹을 사분위수로 구분하고, 그룹별 고혈압과 당뇨병 발생 위험도를 산출하게 된다.
본 시스템의 참조 데이터는 국민건강 영양조사 원시 자료로부터 수집된 자료를 기반으로 식품섭취빈도와 고혈압, 당뇨병의 유병여부 값을 추출하여 데이터베이스에 업로드 한다. 분석을 위해 업로드 한 참조데이터는 국민건강영양조사 2007~2011년도 자료를 통합하여 사전 테스트를 위한 1,021명의 샘플를 제외한 29,406명을 참조데이터로 구성하였다. 다음의 화면은 참조데이터를 업로드하는 페이지로 분석에 활용될 참조데이터를 추가 업로드 할 수 있는 유연한 구조로 설계하였다.
유의성 분석를 위한 실험데이터는 국민건강영양조사제 4기와 제5기(2007-2011) 자료에서 참조데이터 구성 전에 미리 샘플링 한 값으로, 연도별 약 200 샘플을 추출하여 1,021명의 샘플데이터를 집합으로 사용하였다. 1,021명의 샘플데이터를 개인 식품섭취빈도 분석 프로세스에 적용하여 29,406명의 데이터와 유사도 가중치를 산출하여 29,406명과 계산된 유사도가중치 크기에 따라 사분위수로 나누어 4개 집단의 승산비를 계산하였다.
데이터처리
결과 데이터는 로지스틱 회귀분석을 통해 산출된 승산비(Odds Ratio)와 신뢰구간(95% CI: 95% Confidence interval) 을 최종 변수로 출력한다. 출력된 데이터 결과를 화면에서 확인할 수 있다.
이론/모형
데이터간의 유사도를 판별하기 위해 사용자와 유사한 식품섭취빈도를 갖는 이웃을 유사도 가중치로 분석한다. 본 논문에서는 유사도 가중치를 계산하기 위하여 피어슨 상관계수를 이용하였다. 피어슨 상관계수의 공식은 수식 (1)과 같다[10~11].
성능/효과
3배로 차이가 있음 확인할 수 있었다. Q2, Q3에서 모두 정상인군과 당뇨병군을 구분할 수 있었으나 Q4그룹에 비해 차이가 작게 나옴으로서 Q4를 이용한 분석이 가장 유의성이 높음을 확인할 수 있었다. 그림6은 전체 샘플의 유사도 집단별 질병 현황에 따른 당뇨병 발생 위험도를 표시한 것으로 Q4에서 유의한 결과가 나타나는 것을 확인할 수 있다.
8배 높게 산출되었다. Q2, Q3에서도 역시 정상인군에서보다 고혈압군에서 더 높은 고혈압발생위험도를 산출하여 각 그룹별 산정된 고혈압 발생 위험도 값이 실제 고혈압 유병 대상자에서 더 높은 값이 나옴을 확인할 수 있다. 사후검정 결과에서 고혈압전단계군과 고혈압군을 통계적으로 유의하게 구분할 수는 없었으나, 정상인군과 고혈압군을 구분할 수 있었다.
분석 모듈에서 평가하고자 하는 개인의 식품섭취빈도를 입력받아 업로드 되어 있는 참조데이터와 유사도가중치 계산을 통해 상관관계를 추출하고, 상관계수에 따른 유사도 그룹을 산정한다. 그룹별 유병여부를 분석하여 평가하고자 하는 개인과 유사도가 높은 그룹의 승산비와 95% 신뢰구간 결과를 제공한다.
남녀 집단을 분류하여 분석한 결과 남성의 경우 Q4에서 정상군에서 2.291의 고혈압 발생 위험도가 산출된 반면, 고혈압군에서 5.613으로 2.5배 높은 고혈압 발생 위험도를 확인할 수 있었다. 사후검정결과 Q4에서 정상군과 고혈압 전단계군은 집단을 구분할 수 있을 정도의 차이가 발생하지는 않았으나 고혈압군은 확연히 구분할 수 있는 정도의 차이를 보였다.
Q2, Q3에서도 역시 정상인군에서보다 고혈압군에서 더 높은 고혈압발생위험도를 산출하여 각 그룹별 산정된 고혈압 발생 위험도 값이 실제 고혈압 유병 대상자에서 더 높은 값이 나옴을 확인할 수 있다. 사후검정 결과에서 고혈압전단계군과 고혈압군을 통계적으로 유의하게 구분할 수는 없었으나, 정상인군과 고혈압군을 구분할 수 있었다.
33으로 도출되어 당뇨병군에서 확연하게 큰 당뇨병발생위험도가 산출되었다. 사후검정 결과에서 정상인군과 공복혈당장애군 그룹은 구분할 수 없으나, 정상인군과 당뇨병군을 구분할 수 있었다.
5배 높은 고혈압 발생 위험도를 확인할 수 있었다. 사후검정결과 Q4에서 정상군과 고혈압 전단계군은 집단을 구분할 수 있을 정도의 차이가 발생하지는 않았으나 고혈압군은 확연히 구분할 수 있는 정도의 차이를 보였다. Q2에서의 사후검정 결과 역시 Q4와 유사하게 도출되었으나 Q3에서는 정상인군, 고혈압전단계군, 고혈압군의 집단 구별이 가능한 차이를 보임을 확인하였다.
1배 높은 당뇨병 발생 위험도를 확인할 수 있었다. 사후검정결과 정상군과 공복혈당장애군은 집단을 구분할 수 있을 정도의 차이가 발생하지는 않았으나 당뇨병군은 확연히 구분할 수 있는 정도의 차이를 보였다. Q2와 Q3에서도 유사한 구분이 가능한 분석이 이루어 졌으나, Q4에 의한 분석이 가장 유의함을 확인할 수 있었다.
7배 높은 당뇨병 발생 위험도를 보이는 집단으로 분류되었다. 사후검정을 통해 확인한 결과 정상인군과 공복혈당장애군은 구분할 수 있을 만큼의 차이가 발생하지 않았지만, 정상인군과 당뇨병군은 통계적인 분류가 가능할 만큼의 차이를 보이는 것으로 확인되었다. Q2와 Q3 집단에서도 Q4와 유사한 성향을 보이고 있다.
검정 샘플링에서 제외된 29,406명의 데이터의 식품섭취빈도를 기반으로 분석하고자 하는 개인과의 상관관계를 계산하여 유사도 그룹을 사분위수로 구분하고, 그룹별 고혈압과 당뇨병 발생 위험도를 산출하게 된다. 유의성 분석 결과 고혈압과 당뇨병의 실제 유병군에서 정상인군에 비해 더 높은 발생 위험도가 산출되는 통계적으로 유의한 경향을 확인할 수 있어 식품섭취 선호도와 고혈압/ 당뇨의 발생 위험도의 관련성이 있음을 확인하였다. 제안한 시스템은 기존의 역학조사 방법에서 특정 연령군이나 특정 지역에 따른 질병 발생 위험도를 산출하는 방식을 착안하여 개인의 식품섭취 성향에 따른 고혈압과 당뇨병 발생 위험도를 산출함으로써 개인화된 건강 서비스를 제공하기에 새로운 방법으로 사용될 수 있다.
후속연구
다음의 화면은 참조데이터를 업로드하는 페이지로 분석에 활용될 참조데이터를 추가 업로드 할 수 있는 유연한 구조로 설계하였다. 국민건강영양조사 데이터 추가 발생 시 추가하여 분석에 이용할 수 있다.
제안한 시스템은 기존의 역학조사 방법에서 특정 연령군이나 특정 지역에 따른 질병 발생 위험도를 산출하는 방식을 착안하여 개인의 식품섭취 성향에 따른 고혈압과 당뇨병 발생 위험도를 산출함으로써 개인화된 건강 서비스를 제공하기에 새로운 방법으로 사용될 수 있다. 그러나 분석 사용된 참조데이터의 경우, 조사 시점이 한정되어있는 단층연구로 추적에 의한 자료가 아니라는 한계가 있다. 다년간의 조사 자료를 기반으로 참조분석 데이터를 구성하고, 유의성 분석에 활용한 데이터 역시 5개 연도에서 각각 샘플링하여 분석함으로써 시간적 변화의 영향을 감쇄시키고자 하였다.
향후 본 연구의 결과를 토대로 인구통계학적 정보를 추가 분석하고, 특정 질병에 영향을 미치는 식품의 연구 결과를 추가 하여 가중치를 적용하는 연구가 필요하다. 이러한 추가 연구를 통해 개인의 섭취 식품과 만성질환의 관련성 분석을 통해 개인화된 질환 관리 정보로 활용을 할 수 있을 것으로 기대된다.
유의성 분석 결과 고혈압과 당뇨병의 실제 유병군에서 정상인군에 비해 더 높은 발생 위험도가 산출되는 통계적으로 유의한 경향을 확인할 수 있어 식품섭취 선호도와 고혈압/ 당뇨의 발생 위험도의 관련성이 있음을 확인하였다. 제안한 시스템은 기존의 역학조사 방법에서 특정 연령군이나 특정 지역에 따른 질병 발생 위험도를 산출하는 방식을 착안하여 개인의 식품섭취 성향에 따른 고혈압과 당뇨병 발생 위험도를 산출함으로써 개인화된 건강 서비스를 제공하기에 새로운 방법으로 사용될 수 있다. 그러나 분석 사용된 참조데이터의 경우, 조사 시점이 한정되어있는 단층연구로 추적에 의한 자료가 아니라는 한계가 있다.
다년간의 조사 자료를 기반으로 참조분석 데이터를 구성하고, 유의성 분석에 활용한 데이터 역시 5개 연도에서 각각 샘플링하여 분석함으로써 시간적 변화의 영향을 감쇄시키고자 하였다. 향후 본 연구의 결과를 토대로 인구통계학적 정보를 추가 분석하고, 특정 질병에 영향을 미치는 식품의 연구 결과를 추가 하여 가중치를 적용하는 연구가 필요하다. 이러한 추가 연구를 통해 개인의 섭취 식품과 만성질환의 관련성 분석을 통해 개인화된 질환 관리 정보로 활용을 할 수 있을 것으로 기대된다.
질의응답
핵심어
질문
논문에서 추출한 답변
개인화란?
개인화는 개인의 요구를 충족시킬 수 있도록 맞춤화 된 제품/서비스/정보를 제공하는 것을 의미한다[6]. 모든 개인에게 같은 정보를 제공하는 것이 아닌 개인에게 특별한 제품과 서비스를 제공하는 서비스로 마케팅 분야 등에서 판매증대를 위한 방안이 되고 있다.
국민건강 영양조사 자료 활용의 한계점은?
국가통계자료 중 국민건강 영양조사 자료의 활용 방법은 역학조사를 통해 얻어진 정보를 특정 집단과 성별, 연령에 따른 질병에 관한 일반적인 정보를 제공하는 것에 그치고 있다. 이러한 일반화된 건강정보는 건강에 대한 인식 개선은 가능하지만 각 개인의 성향을 분석한 것이 아니므로 실질적인 영향을 미치지 못한다. 본 연구에서는 한국인을 대상으로 조사되어온 국민건강 영양조사 자료를 기반으로 개인의 데이터를 분석하여 개인의 식품섭취 선호도가 고려된 분석을 통해 고혈압과 당뇨의 위험도 평가 시스템을 구현하고자 하였다.
개인화 방법의 일환인 웹 마케팅은 무엇인가?
모든 개인에게 같은 정보를 제공하는 것이 아닌 개인에게 특별한 제품과 서비스를 제공하는 서비스로 마케팅 분야 등에서 판매증대를 위한 방안이 되고 있다. 개인화 방법으로 사용자가 접근한 로그를 분석하여 개인의 성향을 파악하거나, 구매내역 등을 통한 선호도 기반의 개인 성향을 파악하는 웹 마케팅이 일반화 되고 있다[7]. 하지만 개인의 식품 섭취의 선호도 분석을 통한 개인화 서비스에 대한 접근은 미비하다.
참고문헌 (11)
C. H. Lee, S. Y. Lee and T. C. Chung, "Application recommender system based on personalized collaborative-filtering using user's emotion information from smartphone," KOREA INFORMATION SCIENCE SOCIETY, Vol.39 No.1A pp. 224-226, 2012.
B. K. Lim and B. T. Zhang, "Personalized Menu Recommendation Algorithm using Hypernetwork," KOREA INFORMATION SCIENCE SOCIETY, Vol.39 No.1B pp. 393-395, 2012.
D. H. Kim, S. H. Kim, K. Y. Cho and J. S. Cho, "u-DailyCare : Design and Implementation of prevention and Management Sevice for chronic and Adult disease," KOREA INFORMATION SCIENCE SOCIETY, Vol.39 No.1A pp. 197-199, 2012.
J. H. Park, W. I. Park, Y. K. Kim and J. H. Kang, "A Customized Device Recommender System based on Context-Aware in Ubiquitous Environments," The Institute of Electronics Engineers of Korea - Computer and Information, Vol.46 No.3, pp. 15-23 , 2009.
Korea Centers For Disease Control & Prevention, "Guideline: The Fifth Korea National Health and Nutrition Examination Survey (KNHANES V-2)", 2012.
R. R.. Dholakia, interactivity and revisits to website, 2000, http://ritim.cbn.uri.edu/wp/
J. K. Kim, J. H. Suh, D. H. Ann and Y. H. Cho, "A Personalized Recommendation Methodology based on Collaborative Filtering," INTELLIGENT SOCIETY, vol. 8, pp. 139-157, 2002.
R. M. van Dam, E. B. Rimm, W. C. Willett, M. J. Stampfer, and F. B. Hu, "Dietary Patterns and Risk for Type 2 Diabetes Mellitus in U.S. Men," Annals of Internal Medicine, vol. 136, no. 3, pp. 201-209, 2002.
S. H. Jeon and N. H. Kim, "Prevalence of Diabetes and Impaired fasting glucose according to Food frequency Similarity in Korea," Journal of the Korea Academia-Industrial cooperation Society, vol. 14, pp. 751-758, 2013.
S. H. Jeon and N. H. Kim, "Diabetes Risk Analysis Model with Personalized Food Intake Preference," Journal of the Korea Academia-Industrial cooperation Society, Vol. 14, No. 11, pp. 5771-5777, 2013.
K. Y. Jung and J. H. Lee, "Comparative Evaluation of User Similarity Weight for Improving Prediction Accuracy in Personalized Recommender System," The Institute of Electronics Engineers of Korea - Computer and Information, Vol.42 No.6, pp. 63-74, 2005.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.