최근 기업들이 빅데이터를 활용하여 효과적인 마케팅 전략을 전개함에 있어서, 고객의 세부정보를 기반으로 하는 개인화된 마케팅 전략을 활용하고 있다. 하지만 프라이버시 및 개인정보 유출위협이 커짐에 따라 소셜 네트워크 사이트 (Social Network Site, 이하 SNS) 에서 계정의 개인정보 항목을 삭제하거나 정보공개수준을 통제하는 경향이 높아지고 있다. 이로 인해 기업의마케팅 담당자들은 고객의 세부정보를 파악하는 것에 어려움을 겪고 있다. 사람이 하는 예측이 아닌 고객의 성향적 정보만을 통하여 사람이 아닌 기계가 얼만큼 예측할 수 있느냐에 대한 연구로, 본 연구에서는 SNS 중에서 가장 많은 회원 수를 보유하고 있는 페이스북에서 제한된 정보를 바탕으로 성별을 예측하는 분석방법론을 도출하고자 하였다. 수차례의 데이터 전처리와 ...
최근 기업들이 빅데이터를 활용하여 효과적인 마케팅 전략을 전개함에 있어서, 고객의 세부정보를 기반으로 하는 개인화된 마케팅 전략을 활용하고 있다. 하지만 프라이버시 및 개인정보 유출위협이 커짐에 따라 소셜 네트워크 사이트 (Social Network Site, 이하 SNS) 에서 계정의 개인정보 항목을 삭제하거나 정보공개수준을 통제하는 경향이 높아지고 있다. 이로 인해 기업의마케팅 담당자들은 고객의 세부정보를 파악하는 것에 어려움을 겪고 있다. 사람이 하는 예측이 아닌 고객의 성향적 정보만을 통하여 사람이 아닌 기계가 얼만큼 예측할 수 있느냐에 대한 연구로, 본 연구에서는 SNS 중에서 가장 많은 회원 수를 보유하고 있는 페이스북에서 제한된 정보를 바탕으로 성별을 예측하는 분석방법론을 도출하고자 하였다. 수차례의 데이터 전처리와 singular value decomposition (SVD) 차원축소 기법을 사용하여 데이터 셋을 만들었다. 마지막으로, 기계학습 방법론 randomForest 를 사용하였다. 그 결과, 성별은 88.66%, 연령대는 77.91%, 그리고 학력은 56.96%로 페이지 ‘좋아요’ 정보만을 가지고 예측할 수 있었다. 즉, 사용자들의 어떠한 세부정보 없이, 페이스북의 페이지 ‘좋아요’의 정보를 가지고 인구통계학적인 정보를 추론할 수 있었다. 본 연구의 결과를 바탕으로 개인정보 수집에 어려움을 겪고 있는 기업 및 마케팅 담당자들에게 유용한 가이드 라인을 제시 할 수 있을 것으로 기대한다.
최근 기업들이 빅데이터를 활용하여 효과적인 마케팅 전략을 전개함에 있어서, 고객의 세부정보를 기반으로 하는 개인화된 마케팅 전략을 활용하고 있다. 하지만 프라이버시 및 개인정보 유출위협이 커짐에 따라 소셜 네트워크 사이트 (Social Network Site, 이하 SNS) 에서 계정의 개인정보 항목을 삭제하거나 정보공개수준을 통제하는 경향이 높아지고 있다. 이로 인해 기업의마케팅 담당자들은 고객의 세부정보를 파악하는 것에 어려움을 겪고 있다. 사람이 하는 예측이 아닌 고객의 성향적 정보만을 통하여 사람이 아닌 기계가 얼만큼 예측할 수 있느냐에 대한 연구로, 본 연구에서는 SNS 중에서 가장 많은 회원 수를 보유하고 있는 페이스북에서 제한된 정보를 바탕으로 성별을 예측하는 분석방법론을 도출하고자 하였다. 수차례의 데이터 전처리와 singular value decomposition (SVD) 차원축소 기법을 사용하여 데이터 셋을 만들었다. 마지막으로, 기계학습 방법론 randomForest 를 사용하였다. 그 결과, 성별은 88.66%, 연령대는 77.91%, 그리고 학력은 56.96%로 페이지 ‘좋아요’ 정보만을 가지고 예측할 수 있었다. 즉, 사용자들의 어떠한 세부정보 없이, 페이스북의 페이지 ‘좋아요’의 정보를 가지고 인구통계학적인 정보를 추론할 수 있었다. 본 연구의 결과를 바탕으로 개인정보 수집에 어려움을 겪고 있는 기업 및 마케팅 담당자들에게 유용한 가이드 라인을 제시 할 수 있을 것으로 기대한다.
Custom marketing is one of the core methods in strategic marketing. With Big Data analysis, companies become capable of segmenting customers with details. Although Big Data analysis has great potentials in many fields, massive amount of data is required. In order to meet this requirement, companies ...
Custom marketing is one of the core methods in strategic marketing. With Big Data analysis, companies become capable of segmenting customers with details. Although Big Data analysis has great potentials in many fields, massive amount of data is required. In order to meet this requirement, companies attract customers with special events, such as giving free samples or trial opportunity. However, since customer privacy has become a critical issue, instead of helping companies, people start erasing their personal information and filing false data on the internet. Even though there are some limitations on collecting customer data, social network sites are one of the most well-known data pools in the world. Our study use Facebook as a prime social network site and its key feature called ‘Likes’ as a data set to predict user's basic demography, such as age, sex, and educational background. To make an accurate analysis for the study, ‘Likes’ data has been processed by using singular value decomposition (SVD) for dimensionality reduction. With the machine learning technique randomForest, the result shows that sex has 88.66%, age has 77.91%, and educational background has 56.96% accuracy rate. From this study, we expect to provide a useful and efficient guideline for companies who are suffering to make an accurate customer analysis.
Custom marketing is one of the core methods in strategic marketing. With Big Data analysis, companies become capable of segmenting customers with details. Although Big Data analysis has great potentials in many fields, massive amount of data is required. In order to meet this requirement, companies attract customers with special events, such as giving free samples or trial opportunity. However, since customer privacy has become a critical issue, instead of helping companies, people start erasing their personal information and filing false data on the internet. Even though there are some limitations on collecting customer data, social network sites are one of the most well-known data pools in the world. Our study use Facebook as a prime social network site and its key feature called ‘Likes’ as a data set to predict user's basic demography, such as age, sex, and educational background. To make an accurate analysis for the study, ‘Likes’ data has been processed by using singular value decomposition (SVD) for dimensionality reduction. With the machine learning technique randomForest, the result shows that sex has 88.66%, age has 77.91%, and educational background has 56.96% accuracy rate. From this study, we expect to provide a useful and efficient guideline for companies who are suffering to make an accurate customer analysis.
주제어
#빅데이터 분석 소셜네트워크 서비스 좋아요 기계학습 랜덤포레스트 데이터 마이닝 big data analytics social network services SNS likes machine learning random forest data mining
학위논문 정보
저자
유성종
학위수여기관
연세대학교 정보대학원
학위구분
국내석사
학과
디지털 경영 전공
지도교수
이준기
발행연도
2017
총페이지
v, 24장
키워드
빅데이터 분석 소셜네트워크 서비스 좋아요 기계학습 랜덤포레스트 데이터 마이닝 big data analytics social network services SNS likes machine learning random forest data mining
※ AI-Helper는 부적절한 답변을 할 수 있습니다.