인터넷이 보급됨에 따라 소셜 미디어로부터 생성된 개인의 의견, 감정뿐만 아니라 사회현상 등 수 많은 정보들을 담고 있는 소셜 빅데이터는 그 자체로 분석할 가치가 있다. 그러나, 빅데이터 문제에서 말하듯 크기, 속도, 다양성으로 인해 분석하기 힘든데 더해 도메인 특정 데이터의 경우에는 도메인 전문 지식 없이 데이터 분석을 수행하는 작업은 매우 어려운 일이다. 이러한 소셜 빅데이터를 분석하기 위해서는 ...
인터넷이 보급됨에 따라 소셜 미디어로부터 생성된 개인의 의견, 감정뿐만 아니라 사회현상 등 수 많은 정보들을 담고 있는 소셜 빅데이터는 그 자체로 분석할 가치가 있다. 그러나, 빅데이터 문제에서 말하듯 크기, 속도, 다양성으로 인해 분석하기 힘든데 더해 도메인 특정 데이터의 경우에는 도메인 전문 지식 없이 데이터 분석을 수행하는 작업은 매우 어려운 일이다. 이러한 소셜 빅데이터를 분석하기 위해서는 머신러닝, 텍스트마이닝, 소셜 네트워크 분석 등과 같은 다양한 분석기법들이 연구되고 있다. 한편 실세계에서 발생할 수 있는 다양한 관계들은 그래프 구조로 정의가 가능하기 때문에, 다양한 형식의 빅데이터에 대해 그래프 이론에서 사용되는 척도와 분석기법들을 활용하여 다양한 분석을 수행할 수 있다. 하지만, 소셜 빅데이터에서 많은 부분을 차지하는 비정형 데이터는 기존의 정형화된 데이터들에 비해 직접적으로 그래프로 모델링 하여 분석하기 까다롭다. 비정형 데이터 중에서 특히 텍스트로 구성된 비정형 텍스트 데이터는 소셜 미디어에서 많은 부분을 차지하고 있고, 영상이나 이미지 같은 다른 비정형 데이터들의 크기에 비해 더 많은 정보를 담고 있기 때문에 더욱더 중요하다. 본 논문에서 제안하는 소셜 빅데이터를 활용한 그래프 기반 분석 시스템에서는 소셜 미디어로부터 데이터를 수집하고, 본 연구에서 제안하는 시드 문맥의 개념을 활용하여, 데이터 도메인에 대한 전문적인 지식 없이 데이터에 대한 의미를 확장시키고, 정형화시키는 방법에 대해 설명한다. 또한 정형화된 데이터를 이용하여 그래프 구조로 모델링하고 다양한 분석기법을 적용하는 방법에 대해서 설명한다. 실험을 통해 본 논문에서 제안하는 방법과 기존 방법에 대해서 비교하고, 토론을 통해 향후 발전시켜 나가야 할 부분에 대해서 언급하였다. 본 연구를 통해 분석된 결과는 검색이나 추천 등 다양한 분야에서 사용할 수 있으며, 이를 활용하여 복잡한 과정의 소셜 빅데이터 분석 및 활용을 간단화 할 수 있을 것이다.
인터넷이 보급됨에 따라 소셜 미디어로부터 생성된 개인의 의견, 감정뿐만 아니라 사회현상 등 수 많은 정보들을 담고 있는 소셜 빅데이터는 그 자체로 분석할 가치가 있다. 그러나, 빅데이터 문제에서 말하듯 크기, 속도, 다양성으로 인해 분석하기 힘든데 더해 도메인 특정 데이터의 경우에는 도메인 전문 지식 없이 데이터 분석을 수행하는 작업은 매우 어려운 일이다. 이러한 소셜 빅데이터를 분석하기 위해서는 머신러닝, 텍스트마이닝, 소셜 네트워크 분석 등과 같은 다양한 분석기법들이 연구되고 있다. 한편 실세계에서 발생할 수 있는 다양한 관계들은 그래프 구조로 정의가 가능하기 때문에, 다양한 형식의 빅데이터에 대해 그래프 이론에서 사용되는 척도와 분석기법들을 활용하여 다양한 분석을 수행할 수 있다. 하지만, 소셜 빅데이터에서 많은 부분을 차지하는 비정형 데이터는 기존의 정형화된 데이터들에 비해 직접적으로 그래프로 모델링 하여 분석하기 까다롭다. 비정형 데이터 중에서 특히 텍스트로 구성된 비정형 텍스트 데이터는 소셜 미디어에서 많은 부분을 차지하고 있고, 영상이나 이미지 같은 다른 비정형 데이터들의 크기에 비해 더 많은 정보를 담고 있기 때문에 더욱더 중요하다. 본 논문에서 제안하는 소셜 빅데이터를 활용한 그래프 기반 분석 시스템에서는 소셜 미디어로부터 데이터를 수집하고, 본 연구에서 제안하는 시드 문맥의 개념을 활용하여, 데이터 도메인에 대한 전문적인 지식 없이 데이터에 대한 의미를 확장시키고, 정형화시키는 방법에 대해 설명한다. 또한 정형화된 데이터를 이용하여 그래프 구조로 모델링하고 다양한 분석기법을 적용하는 방법에 대해서 설명한다. 실험을 통해 본 논문에서 제안하는 방법과 기존 방법에 대해서 비교하고, 토론을 통해 향후 발전시켜 나가야 할 부분에 대해서 언급하였다. 본 연구를 통해 분석된 결과는 검색이나 추천 등 다양한 분야에서 사용할 수 있으며, 이를 활용하여 복잡한 과정의 소셜 빅데이터 분석 및 활용을 간단화 할 수 있을 것이다.
As the Internet becomes more widespread, social big data, which contains a lot of information such as personal opinions, emotions and social phenomena, is worth analyzing itself. However, these data is difficult to analyze because of their volume, velocity and variety (3V). In addition, in the case ...
As the Internet becomes more widespread, social big data, which contains a lot of information such as personal opinions, emotions and social phenomena, is worth analyzing itself. However, these data is difficult to analyze because of their volume, velocity and variety (3V). In addition, in the case of domain-specific data, it is very difficult to analyze data without domain expertise. To solve these social big data problem, various analysis techniques such as machine learning, text mining and social network analysis were studied. Since the various relationships that can occur in real world can be defined by the graph structure, many analysis techniques were used in this structure based on graph theory. However, a huge portion of social big data is unstructured text data. This unstructured data is hard to analyze. Unstructured text data is much more important because it takes up a large portion of social media and contains more information than the size of other unstructured data such as images and movie. In this paper, improved social big data analysis system on semantic-expansion of unstructured data and graph modeling, which collects data from social media and formalizes the data with the concept of seed context. The seed context is auxiliary input that can formalize data without domain-expert knowledge. Using the graph model, the proposed method to model the data as graphical structure and to be applied to various applications has been explained. Finally, proposed methods compare with previous research through the experiment The results of this study can be used in various fields such as information retrieval system, curating system, and recommendation system, and it will be able to simplify the analysis and application of social big data of complex process.
As the Internet becomes more widespread, social big data, which contains a lot of information such as personal opinions, emotions and social phenomena, is worth analyzing itself. However, these data is difficult to analyze because of their volume, velocity and variety (3V). In addition, in the case of domain-specific data, it is very difficult to analyze data without domain expertise. To solve these social big data problem, various analysis techniques such as machine learning, text mining and social network analysis were studied. Since the various relationships that can occur in real world can be defined by the graph structure, many analysis techniques were used in this structure based on graph theory. However, a huge portion of social big data is unstructured text data. This unstructured data is hard to analyze. Unstructured text data is much more important because it takes up a large portion of social media and contains more information than the size of other unstructured data such as images and movie. In this paper, improved social big data analysis system on semantic-expansion of unstructured data and graph modeling, which collects data from social media and formalizes the data with the concept of seed context. The seed context is auxiliary input that can formalize data without domain-expert knowledge. Using the graph model, the proposed method to model the data as graphical structure and to be applied to various applications has been explained. Finally, proposed methods compare with previous research through the experiment The results of this study can be used in various fields such as information retrieval system, curating system, and recommendation system, and it will be able to simplify the analysis and application of social big data of complex process.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.