주식회사 리나소프트 / 부산광역시 사하구 낙동남로****번길 * , ***호(하단동, 나산 리버빌)
대리인 / 주소
정병홍
심사청구여부
있음 (2018-10-23)
심사진행상태
등록결정(일반)
법적상태
소멸
초록
본 발명은 머신러닝을 이용한 리뷰 분석 방법에 관한 것으로, 더욱 구체적으로는 앱 리뷰에 대한 감성분석과 감성을 나타내게 한 원인요인을 도출하며, 앱 스토어 리뷰에 최적화된 처리방법을 제공하는 머신러닝을 이용한 리뷰 분석 방법에 관한 것이다.
대표청구항▼
데이터 수집기를 사용하여 앱리뷰 데이터를 수집하고, 리뷰의 평점에 따라 부정, 중립, 긍정으로 1차 분류한 후, 반어적 표현, 중립적인 표현을 긍정 또는 부정으로 최종 분류한 머신러닝 지도학습용 감성사전을 포함하는 컴퓨터를 이용하는 리뷰 분석 방법에 있어서,데이터 수집기를 사용하여 앱 리뷰 데이터를 수집하는 데이터 수집단계;상기 데이터 수집단계에서 수집한 상기 데이터 내의 문장 부호를 제거, 영어 대문자를 소문자로 변경 중 어느 하나 이상이 되는 규칙에 따라 변환하는 데이터 정규화 단계;상기 데이터 정규화 단계에서 변환된 데이터를
데이터 수집기를 사용하여 앱리뷰 데이터를 수집하고, 리뷰의 평점에 따라 부정, 중립, 긍정으로 1차 분류한 후, 반어적 표현, 중립적인 표현을 긍정 또는 부정으로 최종 분류한 머신러닝 지도학습용 감성사전을 포함하는 컴퓨터를 이용하는 리뷰 분석 방법에 있어서,데이터 수집기를 사용하여 앱 리뷰 데이터를 수집하는 데이터 수집단계;상기 데이터 수집단계에서 수집한 상기 데이터 내의 문장 부호를 제거, 영어 대문자를 소문자로 변경 중 어느 하나 이상이 되는 규칙에 따라 변환하는 데이터 정규화 단계;상기 데이터 정규화 단계에서 변환된 데이터를 형태소 단위로 분리하고, 형태소 사전에 등록되지 않는 단어가 있는 경우 사용자 사전에 등록하고, 불용어로 사용될 불용어 단어 사전을 생성하여 상기 불용어 단어 사전에 등록된 불용어를 제거하고, 각 형태소의 품사를 결정하는 형태소 분석단계;상기 형태소 분석단계에서 분석된 상기 데이터를 받아, 훈련용 데이터와 검증용 데이터로 분류하고, 훈련용 데이터를 연구자가 직접 긍정, 부정, 중립으로 분류하고, 머신러닝 알고리즘에 입력하여 감성분석 모델을 생성하는 감성분석 모델 생성 단계;상기 감성분석 모델에 상기 앱 리뷰 데이터를 입력하여 감성을 분석하는 감성분석 단계;상기 형태소 분석단계에서 분석된 상기 데이터를 받아, 자주 사용되는 단어 와 연관된 유사 단어를 계산하는 연관단어 분석단계;리뷰 데이터를 확인 후 긍정, 부정, 중립 중 어느 하나로 감성을 분류하는 단계;상기 리뷰 데이터의 평점을 이용하여 1차 감성 분류 후 평점 별 리뷰를 무작위로 추출하여 감성을 분류하는 단계;서비스 사용자가 감성분석 분류결과를 수동으로 변경할 경우 사용자가 변경한 결과값을 DB에 저장된 리뷰 데이터에 별도로 저장 별도로 저장된 데이터를 감성분석 분석모델 훈련용 데이터에 추가하는 단계;추가된 상기 훈련용 데이터를 이용해 다시 감성분석 분류모델을 만드는 학습 과정을 거치는 단계;를 포함하고,상기 감성분석 모델 생성 단계는,상기 형태소 분석 단계에서 형태소 분석된 데이터를 임의로 훈련용 데이터와 검증용 데이터로 분류하는 리뷰 데이터 분류 단계;상기 리뷰 데이터 분류 단계에서 감성 분류된 상기 훈련용 데이터를 벡터로 변환하는 리뷰 벡터 변환 단계;상기 리뷰 벡터를 머신러닝 모델에 적용하여 감성분석 모델을 생성하는 데이터 적용 단계;상기 형태소 분석 단계에서 형태소 분석된 데이터를 임의로 훈련용 데이터와 검증용 데이터로 분류하는 리뷰 데이터 분류 단계;평점에 따라 긍정, 부정, 중립 중 어느 하나의 감성으로 상기 훈련용 데이터를 분류하는 평점 분류 단계;상기 평점 분류 단계에서 긍정, 부정으로 분류된 상기 훈련용 데이터와, 상기 리뷰 데이터 분류 단계에서 분류된 상기 훈련용 데이터를 벡터로 변환하는 리뷰 벡터 변환 단계;상기 리뷰 벡터를 머신러닝 모델에 적용하여 감성분석 모델을 생성하는 데이터 적용 단계;상기 검증용 데이터를 상기 감성분석 모델에 적용하여 상기 감성분석 모델의 정분류율을 검출하는 검증용 테이터 감성분석 단계;상기 정분류율이 가장 높은 감성분석 모델을 선택하는 감성분석 모델 선택 단계를 포함하고,상기 형태소 분석단계는,핵심 키워드, 수식어, 강조어를 추출하여 강조어 유무에 따라 가중치를 부여하고, 상기 감성사전과 태깅된 단어를 매칭하여 일치하는 단어를 찾고, 매칭되는 단어의 가중치에 따라 우선순위를 계산하여, 가중치가 높은 비율에 따라 결과를 데이터로 저장하는 단계를 포함하고,상기 결과를 데이터로 저장하는 단계는,감성사전과 단어매칭 시 문맥내용과 다른 결과가 나오는 것을 방지하기 위해, 문장 내 접속사가 있을 경우, 접속사의 종류에 따라 전후 문장에 포함된 단어의 감성 가중치 변경 적용하고, 동일한 단어의 문장 내 사용빈도에 따라 감성 우선순위 부여하고, 반어적 표현이나 복합 표현에 대한 구분을 위해 우선순위 부여하는 것을 특징으로 하는 머신러닝을 이용한 리뷰 분석 방법
연구과제 타임라인
LOADING...
LOADING...
LOADING...
LOADING...
LOADING...
이 특허에 인용된 특허 (2)
[한국]
오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법 |
정은희,
이병관,
오리 사우드 카마라,
아판디 유슬리나 티파니,
조윤성,
심재오,
김신미
※ AI-Helper는 부적절한 답변을 할 수 있습니다.