보고서 정보
주관연구기관 |
서강대학교 Sogang University |
연구책임자 |
오경환
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2004-06 |
과제시작연도 |
2003 |
주관부처 |
과학기술부 |
사업 관리 기관 |
한국과학재단 Korea Science and Engineering Foundtion |
등록번호 |
TRKO200400001446 |
과제고유번호 |
1350020335 |
사업명 |
나노바이오기술개발 |
DB 구축일자 |
2013-04-18
|
키워드 |
신경망.은닉변수.데이터 마이닝.정보분석/여과/분류.인지심리학 모델.Neural Network.Latent Variable.Data Mining.Information Analysis/Filtering/ Classification.Cognitive Psychology Model.
|
초록
▼
본 연구 과제의 성공적 추진을 위해 정보 분류, 여과, 추출 등에 관한 인지심리학 기반의 기계 학습 기술과 웹컨텐츠 마이닝 기술에 대하여 연구하며, 궁극적으로 고성능의 정보 제공 시스템을 위한 기술을 개발하였으며, 이를 위해 아래와 같은 연구를 하였다.
▷ 텍스트 정보 분석을 위한 은닉변수 신경망 모델 개발
▷ 다양한 웹 컨텐츠 정보의 분석, 분류, 여과 방법 연구
▷ 정보분류 시스템 탐색 및 인지심리학, 수리심리학적 모형 개발
▷ 은닉변수 신경망 학습 기반의 정보 검색 기술 개발
▷ 인간에게 적합한 시스
본 연구 과제의 성공적 추진을 위해 정보 분류, 여과, 추출 등에 관한 인지심리학 기반의 기계 학습 기술과 웹컨텐츠 마이닝 기술에 대하여 연구하며, 궁극적으로 고성능의 정보 제공 시스템을 위한 기술을 개발하였으며, 이를 위해 아래와 같은 연구를 하였다.
▷ 텍스트 정보 분석을 위한 은닉변수 신경망 모델 개발
▷ 다양한 웹 컨텐츠 정보의 분석, 분류, 여과 방법 연구
▷ 정보분류 시스템 탐색 및 인지심리학, 수리심리학적 모형 개발
▷ 은닉변수 신경망 학습 기반의 정보 검색 기술 개발
▷ 인간에게 적합한 시스템의 구축 방식과 구축시 제한점 해결 방안 연구
▷ 신경망 모델 기반의 웹 컨텐츠 마이닝 기술 연구
Abstract
▼
1. Developments of the neural network based on latent variables for text information analysis
- For the purpose of extracting topics and themes from text documents and structure information from HTML documents, we studied, constructed and expanded the basic algorithms of PCA, lCA, LSA, NMF, PLSA,
1. Developments of the neural network based on latent variables for text information analysis
- For the purpose of extracting topics and themes from text documents and structure information from HTML documents, we studied, constructed and expanded the basic algorithms of PCA, lCA, LSA, NMF, PLSA, HMM, Helmholtz machine, increasing the performance and making the analysis easier.
2. Studies on the analysis, classification and filtering methods of vanous kinds of web contents
- We modeled the computational psychological cognitive mechanism and developed the techniques for the analysis, classification and filtering of web contents and applied them to real web circumstances in order to develop the method of recommending appropriate information to users proactively. For that, we developed and expanded the model-based methods of the similarity, the relationship and among the web contents.
3. Developments of the contents classification system and the cognitive psychology model
- We constructed the cognitive psychological model with which human beings actually find, recognize and prefer information, and then expended the basic the methods. In addition, by analyzing the recognition, the similarities of preferences in users' group for the same kind of a large size of web contents we clustered the user group or vice versa.
4. Developments of information retrieval usmg the neural network based on latent variables
- We made the companson and the analysis of the retrieval performance of topic driven indexing methods by using LSA, PLSA, and NMF on both the enormous web documents and the normal text documents. These need the proper measure and method corresponding to the different methods and the dimension of the latent variables should be compared each other. Finally the optimal size of the dimension should be determined by the automatic procedure.
5. Studies on the construction of the human familiar systems
- Systems we aim at should provide the easy and familiar GUI for users, which need the proper metrics with which we measure the user contentment. Measuring can be obtained by the explicit user's feedbacks or implicit feedbacks like click stream, staying time, purchasing, and so on. In large-scaled online systems using big DB, the response time perceived by users is a very important component. It may suggest the more use of the model-based methods over the memory-based methods. The evaluation of the user familiarity must done through the statistical methods.
6. Studies on web mining based on the neural network
- Studies on mining web used to be the memory-based and linear model which doesn't resemble the human brain mechanism in many ways. We studied the non-linear neural network model which represents the brain model more similarly especially the latent variable models showing the high-level concepts.
목차 Contents
- 표지 ...1
- 제출문 ...2
- 보고서 초록 ...3
- 요약문 ...4
- SUMMARY ...11
- CONTENTS ...18
- 목차 ...19
- 제 1 장 연구개발과제의 개요...20
- 제1절 연구개발의 목적 ...20
- 제2절 연구개발의 필요성 ...20
- 제3절 연구개발의 범위 ...22
- 제 2 장 국내외 기술개발 현황...23
- 제1절 국내외 기술개발 및 연구 현황 ...23
- 제2절 현기술상태의 취약성 ...24
- 제 3 장 연구개발수행 내용 및 결과...26
- 제1절 텍스트 문서의 분석/분류/토픽추출을 위한 은닉변수모델 연구 ...26
- 제2절 대규모 문서 데이터 추출 및 분류 ...32
- 제3절 분석/분류 기술을 이용한 생물학 데이터의 마이닝 ...41
- 제4절 축변형을 이용한 LSA 모델 및 이에 기반한 문맥별 단어 중의성 해소 및 문서 분류 ...45
- 제5절 웹 사용자 데이터를 이용한 추천 시스템 ...50
- 제6절 신경망 기반의 군집화 학습 알고리즘의 개발 ...57
- 제7절 비정형적 추론을 이용한 정보 마이닝 기술 개발 ...63
- 제8절 특정 영역의 웹 정보의 분석, 분류, 여과 방법 연구 ...71
- 제 4 장 목표달성도 및 관련분야에의 기여도...78
- 제1절 연구개발 목표의 달성도 ...78
- 제2절 앞으로의 전망 ...81
- 제 5 장 연구개발결과의 활용계획...82
- 제1절 연동 연구적 측면 ...82
- 제2절 기업적 측면 ...83
- 제 6 장 연구개발과정에서 수집한 해외과학기술정보...84
- 제 7 장 참고문헌...85
- 특정연구개발사업 연구결과 활용계획서...90
※ AI-Helper는 부적절한 답변을 할 수 있습니다.