대부분의 기업들은 대량의 데이터베이스에서 정형화된 데이터 뿐만 아니라, 비/반정형화된 데이터를 끊임없이 쌓아만 두고 있는 실정이다. 대부분의 비/반정형화된 데이터를 효율적으로 활용하지 못하고 있기 때문에, 텍스트데이터를 이용하여 의미있고 유용한 정보를 찾을 수 있음에도 불구하고, 텍스트데이터를 처리하기가 쉽지 않고 어떻게 분석해야할지 몰라서 어려움을 겪고 있는 상황임을 인식하였다. 따라서 본 논문에서는 기존의 정형화된 데이터를 이용한 데이터마이닝 기법과 비/반정형화된 텍스트 테이터를 다양한 처리기법으로 정형화된 데이터로 변환한 다음 정형화된 데이터뿐만 아니라 비정형데이터까지 포함시킨 ...
대부분의 기업들은 대량의 데이터베이스에서 정형화된 데이터 뿐만 아니라, 비/반정형화된 데이터를 끊임없이 쌓아만 두고 있는 실정이다. 대부분의 비/반정형화된 데이터를 효율적으로 활용하지 못하고 있기 때문에, 텍스트데이터를 이용하여 의미있고 유용한 정보를 찾을 수 있음에도 불구하고, 텍스트데이터를 처리하기가 쉽지 않고 어떻게 분석해야할지 몰라서 어려움을 겪고 있는 상황임을 인식하였다. 따라서 본 논문에서는 기존의 정형화된 데이터를 이용한 데이터마이닝 기법과 비/반정형화된 텍스트 테이터를 다양한 처리기법으로 정형화된 데이터로 변환한 다음 정형화된 데이터뿐만 아니라 비정형데이터까지 포함시킨 데이터 분석을 이용하여 좀 더 유용하고 의미있는 정보를 찾아내고자 한다. 그 사례로서 Astroserve 통신회사에서 사용되는 정형화된 데이터인 고객 정보데이터와 콜 센터에 걸려오는 비정형화된 고객의 목소리(voice of marketing) 텍스트 데이터를 접목시켰다. 그 결과 기존의 데이터마이닝만을 이용하여 고객 이탈(churn) 모형의 정확도를 예측한 방법보다, 모형의 정확도를 더 높이는 방안으로 고객의 의견 및 문의 내용을 포함한 텍스트 데이터를 분석에 포함시켜 고객이탈 모형의 정확도에 대해 좀 더 예측력이 높은 모형을 제시하였다.
대부분의 기업들은 대량의 데이터베이스에서 정형화된 데이터 뿐만 아니라, 비/반정형화된 데이터를 끊임없이 쌓아만 두고 있는 실정이다. 대부분의 비/반정형화된 데이터를 효율적으로 활용하지 못하고 있기 때문에, 텍스트데이터를 이용하여 의미있고 유용한 정보를 찾을 수 있음에도 불구하고, 텍스트데이터를 처리하기가 쉽지 않고 어떻게 분석해야할지 몰라서 어려움을 겪고 있는 상황임을 인식하였다. 따라서 본 논문에서는 기존의 정형화된 데이터를 이용한 데이터마이닝 기법과 비/반정형화된 텍스트 테이터를 다양한 처리기법으로 정형화된 데이터로 변환한 다음 정형화된 데이터뿐만 아니라 비정형데이터까지 포함시킨 데이터 분석을 이용하여 좀 더 유용하고 의미있는 정보를 찾아내고자 한다. 그 사례로서 Astroserve 통신회사에서 사용되는 정형화된 데이터인 고객 정보데이터와 콜 센터에 걸려오는 비정형화된 고객의 목소리(voice of marketing) 텍스트 데이터를 접목시켰다. 그 결과 기존의 데이터마이닝만을 이용하여 고객 이탈(churn) 모형의 정확도를 예측한 방법보다, 모형의 정확도를 더 높이는 방안으로 고객의 의견 및 문의 내용을 포함한 텍스트 데이터를 분석에 포함시켜 고객이탈 모형의 정확도에 대해 좀 더 예측력이 높은 모형을 제시하였다.
In the large databases of most companies, there are constantly piled up not only structured data, but also un/semi structured data. Because most of the un/semi structured data can't be used effectively, it is not easy to deal with text data and analyze them. despite using text data, we can get some ...
In the large databases of most companies, there are constantly piled up not only structured data, but also un/semi structured data. Because most of the un/semi structured data can't be used effectively, it is not easy to deal with text data and analyze them. despite using text data, we can get some meaningful and useful information. Thus, in this paper, for the un/semi structured data we use a variety of data processing techniques first to transform the un/semi structured text data into structured data, and then use data mining techniques to deal with the structured data. So in this way, we are able to analyze both structured data and un/semi structured data to get more meaningful and useful information. As the case study, in the Astroserve telecommunications firm, structured customer information data were combined with the unstructured customer's voice of marketing text data from call center. In conclusion, we can get more accurate results by using textmining techniques in analysing text data with customer's opinion and queries included compared to the customer churn model accuracy using basic datamining techniques only.
In the large databases of most companies, there are constantly piled up not only structured data, but also un/semi structured data. Because most of the un/semi structured data can't be used effectively, it is not easy to deal with text data and analyze them. despite using text data, we can get some meaningful and useful information. Thus, in this paper, for the un/semi structured data we use a variety of data processing techniques first to transform the un/semi structured text data into structured data, and then use data mining techniques to deal with the structured data. So in this way, we are able to analyze both structured data and un/semi structured data to get more meaningful and useful information. As the case study, in the Astroserve telecommunications firm, structured customer information data were combined with the unstructured customer's voice of marketing text data from call center. In conclusion, we can get more accurate results by using textmining techniques in analysing text data with customer's opinion and queries included compared to the customer churn model accuracy using basic datamining techniques only.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.