머신러닝이란 인공지능의 한 분야로 컴퓨터가 여러 입력 데이터를 통해 학습한 내용을 기반으로 새로운 데이터에 대한 작업을 수행할 수 있도록 하는 것을 말한다. 데이터가 기하급수적으로 생성됨에 따라 정교한 알고리즘에 대한 수요가 증가하면서 전 세계적으로 머신러닝이 도입되고 있다. 숫자, 텍스트, 이미지 등 다양한 형태의 입력 데이터를 기반으로 모델을 구축하며, 특히 예측 문제에서 탁월한 성능을 보인다. 본 논문에서는 머신러닝을 이용하여 입력 데이터의 형태에 따라 정형 데이터와 ...
머신러닝이란 인공지능의 한 분야로 컴퓨터가 여러 입력 데이터를 통해 학습한 내용을 기반으로 새로운 데이터에 대한 작업을 수행할 수 있도록 하는 것을 말한다. 데이터가 기하급수적으로 생성됨에 따라 정교한 알고리즘에 대한 수요가 증가하면서 전 세계적으로 머신러닝이 도입되고 있다. 숫자, 텍스트, 이미지 등 다양한 형태의 입력 데이터를 기반으로 모델을 구축하며, 특히 예측 문제에서 탁월한 성능을 보인다. 본 논문에서는 머신러닝을 이용하여 입력 데이터의 형태에 따라 정형 데이터와 비정형 데이터로 구분하였다. 정형 데이터는 영화의 일일 박스오피스 데이터를 이용하여 특정일의 누적관객수를 예측하였고, 비정형 데이터의 경우에는 이미지와 텍스트를 이용하여 이미지 질의에 대한 응답을 예측하는 연구를 수행하였다. 영화의 누적관객수 예측을 위해 다중선형회귀모형과 Bass 모형을 결합한 Hybrid 모형을 고려한다. 두 모형을 결합함으로써 회귀분석의 예측값을 Bass 모형의 예측값으로 보정하는 효과를 주게 된다. 분석에는 개봉일이 모두 다른 세 영화를 이용하였다. All subset regression 방법을 이용해 모든 가능한 조합을 생성하고 5중 교차검증을 통해 5번 모형을 추정한다. 이 때 제곱근평균오차가 가장 작은 모형으로 예측값을 구한 뒤 Bass 모형의 예측값과 결합해 최종 예측값을 구하게 된다. 과거 데이터가 존재할수록 Bass 모형의 가중치는 증가하면서 예측값에 보정효과를 준다는 것을 확인할 수 있었다. 시각질의응답 연구는 이미지 질의에 대한 응답을 예측하는 연구이다. 영문 데이터의 경우에는 매년 VQA Challenge를 통해 연구가 지속되고 있는 반면 한글 데이터의 경우에는 존재하지 않기 때문에 연구가 진행되는 데에 있어 어려움이 있다. 따라서 본 논문에서는 파파고 번역기를 이용해 한글 시각질의응답 데이터 세트를 구축한 뒤 연구를 수행하였다. 이미지는 VggNet을 이용한 CNN 모델로부터 추출된 특징을 사용하였으며, 한글 질의는 형태소 분석을 거친 뒤의 데이터를 사용하였다. 이후 영문 데이터를 이용한 모델들을 한글 데이터 세트에 적용하고 그 결과를 비교하였을 때, 거의 비슷한 성능을 나타내는 것을 확인할 수 있었다.
머신러닝이란 인공지능의 한 분야로 컴퓨터가 여러 입력 데이터를 통해 학습한 내용을 기반으로 새로운 데이터에 대한 작업을 수행할 수 있도록 하는 것을 말한다. 데이터가 기하급수적으로 생성됨에 따라 정교한 알고리즘에 대한 수요가 증가하면서 전 세계적으로 머신러닝이 도입되고 있다. 숫자, 텍스트, 이미지 등 다양한 형태의 입력 데이터를 기반으로 모델을 구축하며, 특히 예측 문제에서 탁월한 성능을 보인다. 본 논문에서는 머신러닝을 이용하여 입력 데이터의 형태에 따라 정형 데이터와 비정형 데이터로 구분하였다. 정형 데이터는 영화의 일일 박스오피스 데이터를 이용하여 특정일의 누적관객수를 예측하였고, 비정형 데이터의 경우에는 이미지와 텍스트를 이용하여 이미지 질의에 대한 응답을 예측하는 연구를 수행하였다. 영화의 누적관객수 예측을 위해 다중선형회귀모형과 Bass 모형을 결합한 Hybrid 모형을 고려한다. 두 모형을 결합함으로써 회귀분석의 예측값을 Bass 모형의 예측값으로 보정하는 효과를 주게 된다. 분석에는 개봉일이 모두 다른 세 영화를 이용하였다. All subset regression 방법을 이용해 모든 가능한 조합을 생성하고 5중 교차검증을 통해 5번 모형을 추정한다. 이 때 제곱근평균오차가 가장 작은 모형으로 예측값을 구한 뒤 Bass 모형의 예측값과 결합해 최종 예측값을 구하게 된다. 과거 데이터가 존재할수록 Bass 모형의 가중치는 증가하면서 예측값에 보정효과를 준다는 것을 확인할 수 있었다. 시각질의응답 연구는 이미지 질의에 대한 응답을 예측하는 연구이다. 영문 데이터의 경우에는 매년 VQA Challenge를 통해 연구가 지속되고 있는 반면 한글 데이터의 경우에는 존재하지 않기 때문에 연구가 진행되는 데에 있어 어려움이 있다. 따라서 본 논문에서는 파파고 번역기를 이용해 한글 시각질의응답 데이터 세트를 구축한 뒤 연구를 수행하였다. 이미지는 VggNet을 이용한 CNN 모델로부터 추출된 특징을 사용하였으며, 한글 질의는 형태소 분석을 거친 뒤의 데이터를 사용하였다. 이후 영문 데이터를 이용한 모델들을 한글 데이터 세트에 적용하고 그 결과를 비교하였을 때, 거의 비슷한 성능을 나타내는 것을 확인할 수 있었다.
Machine learning is an area of artificial intelligence that allows computers to perform work on new data based on what they learn from various input data. Machine learning is being introduced around the world as the demand for sophisticated algorithms increases as data is generated exponentially. Bu...
Machine learning is an area of artificial intelligence that allows computers to perform work on new data based on what they learn from various input data. Machine learning is being introduced around the world as the demand for sophisticated algorithms increases as data is generated exponentially. Build models based on input data in various forms such as numbers, text, and images, and display excellent performance in forecasting issues. In this paper, machine learning is used to distinguish between structured and unstructured data depending on the type of input data. The structured data were used to predict the cumulative number of visitors for a given day using the daily box office data in the movie, and for unstructured data, studies were conducted to predict the response to image queries using images and text. To estimate the cumulative number of viewers in a movie, consider a hybrid model combining a multi-linear regression model and a Bass model. Combining the two models gives the effect of compensating the predicted value of the regression with the prediction value of the Bass model. The analysis used three different movies with different release dates. Using the All subset progress method, create all possible combinations and estimate the model number 5 through a five-phase cross-test. In this case, the prediction is obtained with the least squares root mean error, and then combined with the prediction of the Bass model to obtain the final prediction. As historical data existed, we could see that the weight of the Bass model increased and that the prediction had a compensating effect. A visual response study is a study that predicts responses to image queries. In the case of English data, the research continues through VQA Challenge every year, while it does not exist in the case of Hangeul data, making it difficult for the research to proceed. Therefore, in this paper, the data sets of visual quality responses in Korean were constructed using papago translators and then researched. The image used features extracted from the CNN model using VGNet, and the Korean query used data after analyzing the morpheme. Afterwards, models using English data were applied to the Korean data set and the results were compared, showing almost similar performance.
Machine learning is an area of artificial intelligence that allows computers to perform work on new data based on what they learn from various input data. Machine learning is being introduced around the world as the demand for sophisticated algorithms increases as data is generated exponentially. Build models based on input data in various forms such as numbers, text, and images, and display excellent performance in forecasting issues. In this paper, machine learning is used to distinguish between structured and unstructured data depending on the type of input data. The structured data were used to predict the cumulative number of visitors for a given day using the daily box office data in the movie, and for unstructured data, studies were conducted to predict the response to image queries using images and text. To estimate the cumulative number of viewers in a movie, consider a hybrid model combining a multi-linear regression model and a Bass model. Combining the two models gives the effect of compensating the predicted value of the regression with the prediction value of the Bass model. The analysis used three different movies with different release dates. Using the All subset progress method, create all possible combinations and estimate the model number 5 through a five-phase cross-test. In this case, the prediction is obtained with the least squares root mean error, and then combined with the prediction of the Bass model to obtain the final prediction. As historical data existed, we could see that the weight of the Bass model increased and that the prediction had a compensating effect. A visual response study is a study that predicts responses to image queries. In the case of English data, the research continues through VQA Challenge every year, while it does not exist in the case of Hangeul data, making it difficult for the research to proceed. Therefore, in this paper, the data sets of visual quality responses in Korean were constructed using papago translators and then researched. The image used features extracted from the CNN model using VGNet, and the Korean query used data after analyzing the morpheme. Afterwards, models using English data were applied to the Korean data set and the results were compared, showing almost similar performance.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.