보고서 정보
주관연구기관 |
숭실대학교 Soongsil University |
연구책임자 |
이수원
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2016-05 |
과제시작연도 |
2015 |
주관부처 |
미래창조과학부 Ministry of Science, ICT and Future Planning |
등록번호 |
TRKO201700011406 |
과제고유번호 |
1711024704 |
사업명 |
중견연구자지원 |
DB 구축일자 |
2017-10-12
|
키워드 |
개방형 혁신.데이터 마이닝.오피니언 마이닝.아이디어 마이닝.SNS 분석.소비자행동이론.소비자 성향.아이디어 온톨로지.Open Innovation.Data Mining.Opinion Mining.Idea Mining.SNS Analysis.Consumer Behavior Theory.VOC.Consumer Preference.Idea Ontology.
|
DOI |
https://doi.org/10.23000/TRKO201700011406 |
초록
▼
본 연구의 최종 목표를 달성을 위한 연차별 연구내용은 다음과 같다
1차년도
▪ 소비자행동 이론에 기초하여 온라인 이용 행동에 대한 소비자 성향을 분석한 결과, 연령이 낮고 페이스북 사용기간이 높을수록, 외향성이 높거나 독특성 욕구가 높은 사람일수록 피드 수가 높은 것으로 나타났다.
▪ 상품 특징 추출을 위한 개체명 인식 기술에서는 ‘다음검색 트렌드’를 이용하여 57,929개의 개체명 추출하였으며, 이를 9개 대분류, 17개 중분류, 60개 소분류로 구분하여 개체명 사전을 구축하였다.
▪ SNS 텍스트 분석을 위
본 연구의 최종 목표를 달성을 위한 연차별 연구내용은 다음과 같다
1차년도
▪ 소비자행동 이론에 기초하여 온라인 이용 행동에 대한 소비자 성향을 분석한 결과, 연령이 낮고 페이스북 사용기간이 높을수록, 외향성이 높거나 독특성 욕구가 높은 사람일수록 피드 수가 높은 것으로 나타났다.
▪ 상품 특징 추출을 위한 개체명 인식 기술에서는 ‘다음검색 트렌드’를 이용하여 57,929개의 개체명 추출하였으며, 이를 9개 대분류, 17개 중분류, 60개 소분류로 구분하여 개체명 사전을 구축하였다.
▪ SNS 텍스트 분석을 위하여 이모티콘이나 연속된 자음 등 형태소 분석이 되지 않는 데이터를 Regular Expression을 이용하여 전처리를 수행하였으며, unigram과 bigram을 결합한 N-gram 방법을 이용하여 특징 단어를 추출하였다.
▪ MSI(MyStarbucksIdea)를 기반으로 핵심적인 기업 혁신 아이디어를 추천하기 위한 분류 모델을 구축하였으며, 실험결과, Naïve Bayes와 SVM의 성능이 가장 높게 나타났다.
▪ 인구통계정보 기반 사용자 관심사 모델을 설계, 구현하였으며, 기존 인기뉴스 추천 방법과의 비교평가를 통해 Cold Start Problem 개선에 대한 가능성을 제시하였다.
2차년도
▪ 소비자 성향요인에 따른 페이스북 팬페이지 가입 행동을 회귀분석을 통하여 검증한 결과, 상태 및 사진 업데이트수 및 친구 수가 많을수록 가입한 팬페이지가 많은 것으로 나타났다. 성향적 요인에서는 공적자기의식과 독특성 욕구가 높을수록, 반면 자존감은 오히려 낮을수록 팬페이지에 더 많이 가입하는 것으로 나타났다.
▪ 감성 어휘 특징을 추출하여 단어의 감성 지수를 자동으로 예측하는 기술을 개발하여 기존 감성사전의 단점인 부족한 감성단어의 수를 보완하였다. (한국어 감성단어 수 935개로 확장)
▪ SNS로부터 감성 분석에 필요한 텍스트만 획득하기 위하여 한국어 문화에 적합한 SNS 텍스트의 유형을 정의하고 자동 분류하였다. 또한 분류한 텍스트에 대한 감성 강도를 계산하는 기술을 개발하였다.
▪ MSI(MyStarbucksIdea.com) 사이트로부터 아이디어에 대한 데이터를 수집하여 CCIO(Co-Creation Idea Ontology)를 구축하고, 아이디어를 추천하기 위한 서비스인 OnCES를 개발하였다.
▪ 페이스북 사용자들의 행동 정보를 분석하여 어떤 특징이 라이프스타일에 영향을 미치는지 검증하고 예측모형을 도출하였다. 실험 결과, 성별의 예측이 가장 용이한 것으로 나타났으며, 그 다음으로 나이, 외향성 순인 것으로 나타났다.
3차년도
▪ 제품유형별 회귀분석을 진행한 결과, 공적자기의식이 높을수록 경험재, 쾌락재, 실용재 팬페이지에 더 가입하였으며, 독특성욕구가 높을수록 탐색재, 경험재, 실용재 팬페이지에 더 가입하는 것으로 나타났다. 반면, 자존감이 높을 경우 쾌락재 팬페이지는 덜 가입하는 것으로 나타났다.
▪ EM 알고리즘을 이용하여 스크린 수와 영화 Box-office와의 상관관계를 도출하였으며, 메타 데이터 기반으로 영화 Box-office 예측 모델을 개발하였다.
▪ 평판 분석을 위해 NNLM(Neural Network Language Model)을 사용하여 대체 어휘 자동 군집화 기술을 개발하였다. 기존 감성단어의 단점인 특징 단어에 대한 대체단어를 자동 군집화하여 감성단어 지수 추정의 정확성을 향상시켰다.
▪ 아이디어 온톨로지와 개방형 혁신 커뮤니티의 구조를 참조하여 OIIO(Open Innovation Idea Ontology)를 구축하였다. 또한 시맨틱 웹 마이닝 기법을 활용하여 고객 아이디어로부터 정보를 추출하고 시맨틱 데이터의 활용 가능성을 검증하기 위한 4가지 서비스를 구현하였다.
▪ 온라인에서 소비자가 작성한 제품에 대한 리뷰 분석을 통해 제품유형을 실용재와 쾌락재로 자동 분류하는 시스템을 개발하였다. 성능 평가를 통하여 기계학습 기법 및 파라미터 최적화를 수행하였다.
(출처: 연구결과 요약문 5p)
Abstract
▼
The following shows yearly progress of the research
First Year Progress
▪ Base on the consumer behavior theory, consumer preference showed: Young age group who uses Facebook longer with extrovert and unique characteristics have a higher feed.
▪ Using ‘Daum Search Trend’ 57,929 Named Entity
The following shows yearly progress of the research
First Year Progress
▪ Base on the consumer behavior theory, consumer preference showed: Young age group who uses Facebook longer with extrovert and unique characteristics have a higher feed.
▪ Using ‘Daum Search Trend’ 57,929 Named Entity were extracted; Among those numbers, 9 were labeled category, 17 were division, and 60 were section to create Named Entity Dictionary.
▪ Certain texts including emoji, continuing consonant and etc. which were not able to analyze data for SNS text analyze were done with Regular Expression to use pre-treatment method; furthermore, using N-gram that are combined with unigram and bigram certain vocabulary were extracted.
▪ Based on MSI (MyStratbucksIdea), division were created to recommend innovative idea, experiment result showed Naïve Bayes and SVM showed the highest performance.
▪ Using demographic information, user’s preference models were designed and embodied. Possibility of Cold Start Problem improvement were presented through comparison of the existing popular news recommendation and demographic information.
Second Year Progress
▪ Regression analysis that was done in consumer preference and joining fan-page showed, user who has frequent update and large numbers of friend showed higher joined fan-page. In chararteristic side, user who has higher public self-consciouness and unique desire with lower self-esteem joined more fan-page.
▪ Extracting emotional vocabulary, were developed to make up for deficient number of emotional vocabulary which was a weak point in current emotion-dictionary. (Korean emotional vocabulary were expended to 935).
▪ In order to achieve text that were necessary to analyze ‘sentiment’ from SNS, SNS text pattern that fit with Korean cultures were defined and categorized. Also, developed a technique to calculate sentimental strength with categorized text.
▪ CCIO(Co-Creation Idea Ontology) were build from idea data in MSI(MyStarbucksIdea.com); OnCES were developed to recommend the idea.
▪ Behavior from Facebook user were analyzed and graphed to see which feature impacts their lifestyle. According to the experiment, sex feature were ease to predict following their ages, and extraversion.
Third Year Progress
▪ Through regression analysis according to type of products, who have higher public self-conscioussess joined fanpage of experiential, hedonic, practical products more and who have more needs of uniqueness joined fanpage of search, experiential and practical goods more. On the other hands, the one with more self-esteem joined fanpage of hedonic products less.
▪ We derived relation between the count of screen and the box-office of movies by using EM Algorithm, and developed a model to predict box-office of movies based on meta-data.
▪ We developed Auto Clustering Technique of Substituting Word by using NNLM(Neural Network Language Model) for reputation analysis. Also Improved the accuracy of estimating degree of sentimental word by auto clustering of substituting words about peculiar word which is a flaw of existing sentimental words.
▪ We established OIIO(Open Innovation Idea Ontology) refer to Idea Ontology and open-type innovation community. Also extracted information from idea of customer by making use of technology of semantic web mining and implemented four sevices to verify possibility of applying semantic data.
▪ We developed the system which classify type of products as practical or hedonic automatically by analyzing the reviews written by customers online. And we carried out optimazing of the parameters and technique of machine learning by estimating performance.
(출처: Summary 6p)
목차 Contents
- 표지 ... 1목차 ... 3연구계획 요약문 ... 4연구결과 요약문 ... 5 요약문 ... 5 SUMMARY ... 6연구내용 및 결과 ... 7 1. 연구개발과제의 개요 ... 7 2. 국내외 기술개발 현황 ... 10 3. 연구수행 내용 및 결과 ... 15 4. 목표달성도 및 관련분야에의 기여도 ... 111 5. 연구결과의 활용계획 ... 113 6. 연구과정에서 수집한 해외 과학기술정보 ... 116 7. 주관연구책임자 대표적 연구실적 ... 119 8. 참고문헌 ... 120 9. 연구성과 ... 122 10. 국가과학기술지식정보서비스에 등록한 연구시설‧장비 현황 ... 128 11. 연구개발과제 수행에 따른 연구실 등의 안전조치 이행실적 ... 128 12. 기타사항 ... 128별첨 ... 129끝페이지 ... 152
※ AI-Helper는 부적절한 답변을 할 수 있습니다.