[논문]비정형 데이터의 의미 확장과 그래프 모델링을 이용한 개선된 소셜 빅데이터 분석 시스템

최승진

비정형 데이터의 의미 확장과 그래프 모델링을 이용한 개선된 소셜 빅데이터 분석 시스템 원문보기

최승진 (中央大學校大學院 컴퓨터공학과 전자상거래 및 인터넷응용 전공 국내박사)

초록 ▼
AI-Helper

인터넷이 보급됨에 따라 소셜 미디어로부터 생성된 개인의 의견, 감정뿐만 아니라 사회현상 등 수 많은 정보들을 담고 있는 소셜 빅데이터는 그 자체로 분석할 가치가 있다. 그러나, 빅데이터 문제에서 말하듯 크기, 속도, 다양성으로 인해 분석하기 힘든데 더해 도메인 특정 데이터의 경우에는 도메인 전문 지식 없이 데이터 분석을 수행하는 작업은 매우 어려운 일이다. 이러한 소셜 빅데이터를 분석하기 위해서는 머신러닝, 텍스트마이닝, 소셜 네트워크 분석 등과 같은 다양한 분석기법들이 연구되고 있다.
한편 실세계에서 발생할 수 있는 다양한 관계들은 그래프 구조로 정의가 가능하기 때문에, 다양한 형식의 빅데이터에 대해 그래프 이론에서 사용되는 척도와 분석기법들을 활용하여 다양한 분석을 수행할 수 있다.
하지만, 소셜 빅데이터에서 많은 부분을 차지하는 비정형 데이터는 기존의 정형화된 데이터들에 비해 직접적으로 그래프로 모델링 하여 분석하기 까다롭다. 비정형 데이터 중에서 특히 텍스트로 구성된 비정형 텍스트 데이터는 소셜 미디어에서 많은 부분을 차지하고 있고, 영상이나 이미지 같은 다른 비정형 데이터들의 크기에 비해 더 많은 정보를 담고 있기 때문에 더욱더 중요하다.
본 논문에서 제안하는 소셜 빅데이터를 활용한 그래프 기반 분석 시스템에서는 소셜 미디어로부터 데이터를 수집하고, 본 연구에서 제안하는 시드 문맥의 개념을 활용하여, 데이터 도메인에 대한 전문적인 지식 없이 데이터에 대한 의미를 확장시키고, 정형화시키는 방법에 대해 설명한다. 또한 정형화된 데이터를 이용하여 그래프 구조로 모델링하고 다양한 분석기법을 적용하는 방법에 대해서 설명한다.
실험을 통해 본 논문에서 제안하는 방법과 기존 방법에 대해서 비교하고, 토론을 통해 향후 발전시켜 나가야 할 부분에 대해서 언급하였다.
본 연구를 통해 분석된 결과는 검색이나 추천 등 다양한 분야에서 사용할 수 있으며, 이를 활용하여 복잡한 과정의 소셜 빅데이터 분석 및 활용을 간단화 할 수 있을 것이다.

Abstract ▼ AI-Helper

As the Internet becomes more widespread, social big data, which contains a lot of information such as personal opinions, emotions and social phenomena, is worth analyzing itself. However, these data is difficult to analyze because of their volume, velocity and variety (3V). In addition, in the case of domain-specific data, it is very difficult to analyze data without domain expertise. To solve these social big data problem, various analysis techniques such as machine learning, text mining and social network analysis were studied.
Since the various relationships that can occur in real world can be defined by the graph structure, many analysis techniques were used in this structure based on graph theory. However, a huge portion of social big data is unstructured text data. This unstructured data is hard to analyze. Unstructured text data is much more important because it takes up a large portion of social media and contains more information than the size of other unstructured data such as images and movie.
In this paper, improved social big data analysis system on semantic-expansion of unstructured data and graph modeling, which collects data from social media and formalizes the data with the concept of seed context. The seed context is auxiliary input that can formalize data without domain-expert knowledge. Using the graph model, the proposed method to model the data as graphical structure and to be applied to various applications has been explained. Finally, proposed methods compare with previous research through the experiment
The results of this study can be used in various fields such as information retrieval system, curating system, and recommendation system, and it will be able to simplify the analysis and application of social big data of complex process.

주제어

학위논문 정보

저자	최승진
학위수여기관	中央大學校大學院
학위구분	국내박사
학과	컴퓨터공학과 전자상거래 및 인터넷응용 전공
지도교수	한상용
발행연도	2018
총페이지	v, 108장
키워드	그래프 이론 비정형 데이터 소셜 빅데이터 의미 확장 분석 시스템
언어	kor
원문 URL	http://www.riss.kr/link?id=T14736793&outLink=K
정보원	한국교육학술정보원

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명(한글), 저자명(한글), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문) 관리번호, 논문명(한글), 논문명(영문), 저자명(한글), 저자명(영문), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문)
저장형식	Text(ASCII format) Excel format
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

비정형 데이터의 의미 확장과 그래프 모델링을 이용한 개선된 소셜 빅데이터 분석 시스템 원문보기

초록 ▼
AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

비정형 데이터의 의미 확장과 그래프 모델링을 이용한 개선된 소셜 빅데이터 분석 시스템 원문보기

초록 ▼ 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

초록 ▼
AI-Helper