의학기술의 발전과 소득수준의 증가로 "건강하게 오래살기"에 관심이 높아지면서 적극적으로 건강을 증진하고 유지하는 웰니스가 확대되고 있다. 또한 맞춤형 의료서비스에 대한 수요가 증가하고 방대한 의료 빅 데이터를 이용한 질병 예방의 움직임도 나타나고 있다. 이 논문에서는, 의료 시장에서 주요 관심분야로 부각되고 있는 웰니스를 지원하기위해 빅 데이터 기반의 의료 질 향상을 통한 환자중심의 의료서비스를 목적으로 한다. 환자를 약물에 의존적으로 치료만 하는 것이 아니라 식생활 개선을 기반으로 질병예방과 치료를 위해 빅데이터를 분석한다. 개인 트윗터를 분석해서 일상생활정보를 획득하고 웰니스 사전을 기반으로 질병예방과 치료를 목적으로 한다. 효율적인 빅데이터 분석을 위해 하둡노드를 증가하면서 데이터 처리시간을 실험하였다. 실험결과 저장시간의 경우 63%, 데이터 통합의 경우 18%, 전체 테스트 시간을 기준으로 26%로 하나의 노드로 처리하는 경우보다 세 개의 노드로 처리하는 것이 효율적임을 실험을 통해 확인하였다.
의학기술의 발전과 소득수준의 증가로 "건강하게 오래살기"에 관심이 높아지면서 적극적으로 건강을 증진하고 유지하는 웰니스가 확대되고 있다. 또한 맞춤형 의료서비스에 대한 수요가 증가하고 방대한 의료 빅 데이터를 이용한 질병 예방의 움직임도 나타나고 있다. 이 논문에서는, 의료 시장에서 주요 관심분야로 부각되고 있는 웰니스를 지원하기위해 빅 데이터 기반의 의료 질 향상을 통한 환자중심의 의료서비스를 목적으로 한다. 환자를 약물에 의존적으로 치료만 하는 것이 아니라 식생활 개선을 기반으로 질병예방과 치료를 위해 빅데이터를 분석한다. 개인 트윗터를 분석해서 일상생활정보를 획득하고 웰니스 사전을 기반으로 질병예방과 치료를 목적으로 한다. 효율적인 빅데이터 분석을 위해 하둡노드를 증가하면서 데이터 처리시간을 실험하였다. 실험결과 저장시간의 경우 63%, 데이터 통합의 경우 18%, 전체 테스트 시간을 기준으로 26%로 하나의 노드로 처리하는 경우보다 세 개의 노드로 처리하는 것이 효율적임을 실험을 통해 확인하였다.
Medical technology development and increase the income level of a "Long and healthy Life=Wellness," with the growing interest in actively promoting and maintaining health and wellness has become enlarged. In addition, the demand for personalized health care services is growing and extensive medical ...
Medical technology development and increase the income level of a "Long and healthy Life=Wellness," with the growing interest in actively promoting and maintaining health and wellness has become enlarged. In addition, the demand for personalized health care services is growing and extensive medical moves of big data, disease prevention, too. In this paper, the main interest in the market, highlighting wellness in order to support big data-driven healthcare quality through patient-centered medical services purposes. Patients with drug dependence treatment is not to diet but to improve disease prevention and treatment based on analysis of big data. Analysing your Tweets-daily information and wellness disease prevention and treatment, based on the purpose of the dictionary. Efficient big data analysis for node while increasing processing time experiment. Test result case of total access time efficient 26% of one node to three nodes and case of data storage is 63%, case of data aggregate is 18% efficient of one node to three nodes.
Medical technology development and increase the income level of a "Long and healthy Life=Wellness," with the growing interest in actively promoting and maintaining health and wellness has become enlarged. In addition, the demand for personalized health care services is growing and extensive medical moves of big data, disease prevention, too. In this paper, the main interest in the market, highlighting wellness in order to support big data-driven healthcare quality through patient-centered medical services purposes. Patients with drug dependence treatment is not to diet but to improve disease prevention and treatment based on analysis of big data. Analysing your Tweets-daily information and wellness disease prevention and treatment, based on the purpose of the dictionary. Efficient big data analysis for node while increasing processing time experiment. Test result case of total access time efficient 26% of one node to three nodes and case of data storage is 63%, case of data aggregate is 18% efficient of one node to three nodes.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이와 같이 영국 의료계는 빅 데이터 활용이 자리를 잡아가고 있다. 연구자들은 현재 유행하고 있는 질병의 발생 장소 및 전염 속도, 주요 질병의 분포, 연도별 증가 등에 대한 통계치를 확보하여 최종적으로 효율적이고 신속한 질병 관리가 가능해지게 해준다. 질병 예측과 예보의 측면에서도 다양한 빅 데이터 활용 사례가 존재한다.
헬스케어 분야에서는 빅 데이터를 활용해 환자의 의무기록은 물론 식생활습관, 직업이력, 등 광범위한 데이터 분석을 통해 치료방법을 개선하고 의료비용을 줄이려는 노력이 진행되고[4] 있으며 이것은 전 세계적으로 생활 수준의 향상과 높은 삶의 질을 성취하고자 건강관리 패러다임이 변화되면서 예방 중심의 웰니스(Wellness)에 대한 관심이 증가한다[4,5,6]. 이 논문에서는 개인 트위터 등 빅 데이터 분석을 기반으로 일상에서 발생되는 실시간 빅 데이터 정보를 분석하여 보건의료 서비스의 질을 향상시킨다. 실시간으로 발생되는 개인 트윗터를 수집한 후 일상생활정보를 획득하고 수집된 정보는 하둡 분산 파일 시스템(HDFS)과 맵-리듀스(Map-Reduce)에서 구축된 웰니스 사전을 기반으로 특정 단어나 패턴을 추출하여 핵심 키워드를 분류한다.
빅 데이터를 분석하기 위해서는 오픈소스 기반의 분산 데이터 저장 기술인 하둡(Hadoop)이 기존 데이터베이스로 관리하기 힘든 규모와 성격의 데이터를 처리하기 위한 기술로 주목받고 있다[9,10,11]. 이 논문에서는 개인의 소셜 미디어를 의료 질 향상 도구로 활용하기 위해 트윗 간의 연관 규칙을 기반으로 웰니스 사전을 구축하고 질병예방과 치료를 목적으로 생활패턴을 분석하여 웰니스를 위한 의료질 향상을 제안한다. 연관규칙을 이용한 소설 미디어의 빅 데이터의 분석은 트위터들의 검색엔진을 통해 수집된 데이터를 축적하고, 이를 이용해 환자군의 일상생활 패턴을 분석한 후 웰니스를 위한 라이프 트래킹 측면의 건강이나, 라이프 사이클에 필요에 다양한 연관성이 있는 부분들을 개인의 성향에 맞게 분석하여 개인의료정보 레코드에 활용한다.
제안 방법
워드카운트는 맵 리듀스 분석을 통해 웹 로그 및 쿼리 로그에서 단어의 빈도를 확인 할 수 있다. R 오브젝트를 기반으로 각 트윗의 단어 빈도를 계산하고, rhocollect 함수를 통해 개별 단어와 빈도수를 하둡 시스템으로 전송한다. [그림2]에서 1차적으로 계산된 리듀스타스크(reduce task)를 단어(key)와 빈도(value)의 누적 합으로 계산한 후 최종 결과 값을 HDFS에 분산 저장한다.
SNS의 트윗을 데이터 크롤링으로 수집된 하둡 시스템에 저장된 메시지를 문장단위로 분리하고 각 문장을 형태소 분석 후 토큰 배열로 변환한다. 변환된 토큰을 웰니스 사전에 웰니스 데이터로 수집하여 저장한다.
이 논문에서는 개인 트위터 등 빅 데이터 분석을 기반으로 일상에서 발생되는 실시간 빅 데이터 정보를 분석하여 보건의료 서비스의 질을 향상시킨다. 실시간으로 발생되는 개인 트윗터를 수집한 후 일상생활정보를 획득하고 수집된 정보는 하둡 분산 파일 시스템(HDFS)과 맵-리듀스(Map-Reduce)에서 구축된 웰니스 사전을 기반으로 특정 단어나 패턴을 추출하여 핵심 키워드를 분류한다. 이렇게 분류된 키워드를 기반으로 환자의 질병예방과 치료를 위해 저장/관리되고 저장된 정보들을 기반으로 보다 정확한 진단과 처방이 가능하도록 개인의료정보 데이터를 기반으로 환자중심의 의료서비스를 제공한다.
이 논문에서는 이와 같이 분석된 빅 데이터의 결과를 기반으로 의료 서비스의 질 향상에 툴로 사용하였다. 의료 질 향상을 위해 개인생활에서 발생되는 패턴의 빅데이터 분석을 통해 질병관리를 위한 다양한 측면을 위한 U-헬스케어 서비스를 위해 유병자의 경우 추가적인 합병증이나 질병의 악화를 방지하고 보균자의 경우 질병 발생 원인을 의약품에만 의존하는 것이 아니라 의약품과 병행된 생활 밀착형 의료서비스를 제공함으로 의학에서 말하는 근거중심의료서비스를 통한 진정한 질병치료 및 질병예방이 가능하게 되었다.
이렇게 분류된 키워드를 기반으로 환자의 질병예방과 치료를 위해 저장/관리되고 저장된 정보들을 기반으로 보다 정확한 진단과 처방이 가능하도록 개인의료정보 데이터를 기반으로 환자중심의 의료서비스를 제공한다. 제안 논문에서는 효율적인 빅 데이터 분석을 위해 하둡 노드를 증가하면서 빅데이터에서 발생된 데이터 처리시간을 실험하였다. 실험결과 데이터 저장시간의 경우 63%, 데이터 통합의 경우 18%, 전체 테스트 시간을 기준으로 26%로 하나의 노드로 처리하는 경우보다 세 개의 노드로 처리하는 것이 효율적임을 실험을 통해 확인하였다.
[그림 1]은 제안 시스템에서 구성한 하둡데이터 처리를 위한 구성으로, 대용량 데이터의 분산 저장 및 신속한 처리를 위해 다수의 컴퓨터를 네트워크로 연결하여 하나의 시스템과 같이 사용할 수 있도록 구성한다. 트위터가 작성한 트윗을 기반으로 특정 단어나 패턴을 추출하고 핵심 키워드를 분류한다.
대상 데이터
미국의 존스 홉킨스대학에서는 소셜 미디어인 트위터를 이용하여 질병 예보 시스템을 개발했으며, 이는 인플루엔자부터 알레르기까지 다양한 종류의 질병 추적이 가능한 기술을 구현하게 되었다. Seton Health Care Family와 IBM 공동개발 솔루션은 연간 200만 명 환자의 진료 정보를 분석, 추적하여 환자가 미래에 겪을 수 있는 질환, 증상을 예측하였다. 더불어 IBM은 심혈관 질환 예측을 통해 심근경색 발병 위험을 줄이는 솔루션도 개발할 수 있었다.
실험을 위해 두 사람의 트위터 데이터를 2014년 5월1일 ~ 8월 10일(102일간) 분석한 결과 [표 4]와 같다. 사용자1은 만성위궤양으로 병원에서 처방받은 약을 복용하는 40대 초반 여성이고, 사용자2는 갑상선 질환으로 치료를 받고 있는 40대 후반 여성으로 트위터를 분석한 결과이다.
웰니스 데이터 분석을 위해 다수의 SNS 계정에 트튓 메세지를 수집한다. 수집된 데이터는 크롤링을 통해 SNS의 팔로윙된 데이터를 수집하고 이를 다시 서버로 전송한다.
데이터처리
네임노드는 데이터 노드에서 전송 받은 메시지를 로컬 디스크에 저장한 후 순차적으로 HDFS의 데이터에 저장한다. 웰니스 데이터 분석은 기존 자연어처리(NLP) 기법을 이용하여 인간의 언어로 쓰인 텍스트 문장을 분석하고 문장에서 주어진 웰니스 정보(의료/건강 관련용어)를 찾아내어 빈도를 계산한다.
cloudPHR 서버는 하둡 파일 시스템과 데이터를 전송하여 레코드 생성을 위한 미들웨어 역할을 수행한다. 하둡파 일 시스템에서 분산처리 저장된 생체정보의 맵 리듀스 프로그래밍에서 맵퍼 코드를 이용해서 클래스는 키 값을 날짜로 지정하고 값은 웰니스 데이터 분석을 수행한 후 빈도를 계산하여 지정한다.
성능/효과
[그림 6]은 [표 5]의 분석결과를 도식화하여 나타낸 것이다. 3개의 노드를 연결한 경우 data storage 과정은 63%와 data aggregate 과정은 18%가량의 성능이 향상되었다. 전체 분석 시간은 26%이상 향상되는 결과를 보였다.
전체 분석 시간은 26%이상 향상되는 결과를 보였다. 따라서 수집된 데이터의 양이 증가할수록 노드수를 증가하여 분산 처리를 수행하는 것이 보다 효율적임을 실험을 통해 확인할 수 있다.
제안 논문에서는 효율적인 빅 데이터 분석을 위해 하둡 노드를 증가하면서 빅데이터에서 발생된 데이터 처리시간을 실험하였다. 실험결과 데이터 저장시간의 경우 63%, 데이터 통합의 경우 18%, 전체 테스트 시간을 기준으로 26%로 하나의 노드로 처리하는 경우보다 세 개의 노드로 처리하는 것이 효율적임을 실험을 통해 확인하였다.
이 논문에서는 이와 같이 분석된 빅 데이터의 결과를 기반으로 의료 서비스의 질 향상에 툴로 사용하였다. 의료 질 향상을 위해 개인생활에서 발생되는 패턴의 빅데이터 분석을 통해 질병관리를 위한 다양한 측면을 위한 U-헬스케어 서비스를 위해 유병자의 경우 추가적인 합병증이나 질병의 악화를 방지하고 보균자의 경우 질병 발생 원인을 의약품에만 의존하는 것이 아니라 의약품과 병행된 생활 밀착형 의료서비스를 제공함으로 의학에서 말하는 근거중심의료서비스를 통한 진정한 질병치료 및 질병예방이 가능하게 되었다. 향후 이 논문에서 수집된 개인 정보보보를 위한 지속적인 연구가 필요하다.
3개의 노드를 연결한 경우 data storage 과정은 63%와 data aggregate 과정은 18%가량의 성능이 향상되었다. 전체 분석 시간은 26%이상 향상되는 결과를 보였다. 따라서 수집된 데이터의 양이 증가할수록 노드수를 증가하여 분산 처리를 수행하는 것이 보다 효율적임을 실험을 통해 확인할 수 있다.
후속연구
의료 질 향상을 위해 개인생활에서 발생되는 패턴의 빅데이터 분석을 통해 질병관리를 위한 다양한 측면을 위한 U-헬스케어 서비스를 위해 유병자의 경우 추가적인 합병증이나 질병의 악화를 방지하고 보균자의 경우 질병 발생 원인을 의약품에만 의존하는 것이 아니라 의약품과 병행된 생활 밀착형 의료서비스를 제공함으로 의학에서 말하는 근거중심의료서비스를 통한 진정한 질병치료 및 질병예방이 가능하게 되었다. 향후 이 논문에서 수집된 개인 정보보보를 위한 지속적인 연구가 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
빅 데이터의 활용이 중요해진 이유는?
최근 들어 빅 데이터의 활용이 사회적 이슈가 되면서 중요성이 점점 더 증가하고 있다. 빅 데이터의 효과적인 활용은 새로운 지식 생산이 가능하고사회경제적 가치를 창출할 수 있기 때문이다. 현재 해외 기업 들의 다양한 빅 데이터 활용이 이루어지고 있는데 민간 분야뿐 아니라 정부를 포함한 공공 부문에서도 빅 데이터를 활용하기 위해 노력하고 있다[1,2].
웰니스란?
웰니스(Wellness)란 건강한 상태를 유지하고 웰빙(well-bing)을 위한 잠재력을 극대화하기 위한 체계적인 노력(process)이다[4]. 웰니스 산업에 대한 관심은 점차 증가 하는 추세인데 행복 추구 및 삶의 질을 목적으로 하는 비의료영역에 IT 융합기술을 적용하는 건강 서비스가 선보이는 것도 이런 추세와 무관하지 않다.
근거중심의학과 질개선의 공통적 특징은?
의료분야에서 환자의 권리 신장 및 제한된 보건의료 자원의 적절한 활용 필요성과 더불어 EBM이 현재 보건의료가 안고 있는 문제를 해결 할 수 있는 하나의 방법론으로 각광을 받게 하는 요인들로 작용하고 있다”고 하여, EBM은 이제 선택이 아닌 필수요소로, 어떻게 시행하느냐가문제로 다가오고 있음을 강조하였다. 한편 근거중심의학과 질개선(quality improvement) 모두 근거와 실무의 간극을 줄이려고 한다는 점에서 공통적 특성이 있지만 기본 원리와 활동방식에 차이가 존재하고 있다.
참고문헌 (14)
Sukja Ko, "Health Risk Prediction Using Big Health Data", The Journal of The Korea Institute for Health and Social Affairs, Vol.13, No.11, pp.43-52, 2012.
Taemin Song, "South Korea health and welfare big data trends and proposals", Science and Technology Policy Institute, Vol.23, No.3, pp.56-73, 2013.
Straus, Sharon E., etal., Evidence-Based Medicine-How to Practiceand Teach EBM, 3thed. Elsevier, London, 2005.
Yongju Park, Gyeongeun Kong, "Wellness centered on big data with our overseas medical industry facts", www.digieco.co.kr, 2013.
Yeonghui Noh etl, "Wellness industry's business model analysis of a study on industrial development-policy report", The National IT Promotion Agency, 2012.
Seongsu Kim, "Building an effective business model of the industry of medical ICT convergence measures for them", www.digieco.co.kr, 2013.
Seongryeol Yoon, "A study on health information communication and security system for PHR service", Gachon University Graduate schools, department of computer engineering, a doctor's thesis, 2013.
Sunhyeong Jung, Jongryeol Park, " Study on Telemedicine system in Medical Law", Journal of The Korea Society of Computer and Information, Vol.17, No.12, pp.241-249, 2012.
Foto N. Afrati, Jeffrey D. Ullman, "Optimizing Multiway Joins in a Map-Reduce Environment," IEEE Transactions on Knowledge and Data Engineering, Vol.23, No.9, pp.1282-1298, 2011.
Pramod Bhatotia, Alexander Wieder, Rodrigo Rodrigues, Umut A. Acar, Rafael Pasquini, "Incoop: MapReduce for Incremental Computations," In Proceedings of SOCC'11, 2011.
Sungsoo Kim, "Study on Big Data Utilization Plans of Medical Institutions", Journal of Digital convergence, Vol.12, No.2, pp.397-407, 2014
Daeseog Heo, "Evidence-based Healthcare in Korea", Korean Medical Association, pp.934-935, 2009.
Yongbin Kim, Problems of Personal Information Protection in Big Data Utilization and an Improvement Method Using PIMS, Kangwon National University industry graduate school,computer information and telecommunication engineering, a master's thesis, 2013.
Youngbok Cho, Sunghee Woo, Sangho Lee, "The cloudHIS System for Personal Healthcare Information Integration Scheme of Cloud Computing Environment", Journal of the Korea society of computer and information, Vol.19, No.5 , pp.27-35, 2014.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.