보고서 정보
주관연구기관 |
퍼스트정보 |
연구책임자 |
정기성
|
참여연구자 |
김동한
,
정길영
,
여찬휘
,
최명일
,
유경림
,
손승일
,
송승환
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2020-10 |
과제시작연도 |
2020 |
주관부처 |
행정안전부 Ministry of the Interior and Safety |
과제관리전문기관 |
국가기록원 National Archives of Korea |
등록번호 |
TRKO202100008607 |
과제고유번호 |
1315001495 |
사업명 |
국가기록관리활용기술연구개발(R&D) |
DB 구축일자 |
2021-08-14
|
키워드 |
기계학습기반 공개재분류.공개재분류.기계학습.Machine learning-based public reclassification.public reclassification.machine learning.
|
초록
▼
■ 최종연구목표
1. (자료 분석) 축적된 공개재분류 기준서 등을 중심으로 자동화·지능화 할 수 있는 비공개 정보대상 유형 및 자료 분석
2. (비공개정보 패턴화) 전자기록물 공개재분류를 위한 비공개정보대상(정보공개법 제9조제1항제6호 중심) 기준 도출 및 패턴화
3. (학습데이터 및 테스트베드 구축) 공개재분류 학습데이터 구축 및 지속적 학습을 위한 테스트베드 구축
■ 연구 결과물
1. 비공개정보대상 유형 및 자료 분석
ㅇ 국가기록원 공개재분류 기준서* 등을 참고하여 비공개정보대상 유형에 따
■ 최종연구목표
1. (자료 분석) 축적된 공개재분류 기준서 등을 중심으로 자동화·지능화 할 수 있는 비공개 정보대상 유형 및 자료 분석
2. (비공개정보 패턴화) 전자기록물 공개재분류를 위한 비공개정보대상(정보공개법 제9조제1항제6호 중심) 기준 도출 및 패턴화
3. (학습데이터 및 테스트베드 구축) 공개재분류 학습데이터 구축 및 지속적 학습을 위한 테스트베드 구축
■ 연구 결과물
1. 비공개정보대상 유형 및 자료 분석
ㅇ 국가기록원 공개재분류 기준서* 등을 참고하여 비공개정보대상 유형에 따른 자료 분석
* 생산기관, 기록물제목, 기록물유형, 대상기록, 비공개 대상정보, 공개 값 및 호수 등
ㅇ 개인정보유형*과 업무분류체계별 개인정보유형에 따른 자료와 기록물 상의 내용 비교 분석
* 일반정보(이름, 주민번호, 주소 등), 가족정보, 교육 및 훈련정보, 병역정보, 부동산 정보, 소득정보, 기타 수익정보, 신용정보, 고용정보, 법적정보, 의료정보, 조직정보, 통신정보, 위치정보,신체정보, 습관 및 취미정보
2. 전자기록물 공개재분류를 위한 비공개정보(정보공개법 제9조 제1항 제6호 중심) 기준 도출 및 패턴화
ㅇ 시중 상용화 되어있는 개인정보 탐지용 S/W 등에서 사용하는 기본 패턴 사례연구분석
ㅇ 기록원 기준서 및 관련 자료, 사례 분석으로 적용 가능한 기준 제시 및 패턴화
- 비공개정보대상 기준 형태 및 패턴 연구(제6호 중심 – 개인정보유형별, 업무분류체계별)
- 전자문서 및 붙임자료에 대한 비공개대상정보 범위, 규칙, 패턴학습 수행
ㅇ 타기관 유사사례 및 활용중인 패턴* 분석 참조
* RMS 공개재분류 기능 사용기관 및 공공기관 개인정보 유사 연구 사례조사
ㅇ 전자기록물 공개재분류 적용 패턴 기준 제시* 및 적용 방안 연구
- 개인정보유형에 따른 패턴과 적용 사례를 유형별로 세부 기준 분석
* 개인정보유형 - 세부유형 - 패턴 형태 - 예시 - 실제 필터링 적용 등
3. 공개재분류 학습데이터 구축 및 지속적 학습을 위한 테스트베드 구축
ㅇ 비공개정보대상 학습데이터 검증 시험을 위한 테스트베드 구축
- LINUX서버, 작업용 PC, 학습기, 문서필터 설치 및 변환 완료
ㅇ 공개재분류 자동화·지능화 적용 시험
- 비공개정보대상 자동 필터링을 위한 자동화·지능화 기술 적용
- 전자기록물의 다양한 유형(한글, MS-OFFICE, PDF 등) 적용 시험
ㅇ 도출된 패턴으로 자동 필터링을 위한 학습데이터 시험
- 비공개대상정보 정확성 및 적합성 향상을 위한 정보 습득 및 학습데이터 구축
- 유형 및 패턴별 시험 결과, 정확도 테스트 및 학습데이터에 피드백
ㅇ 향후 기록물관리시스템(CAMS, RMS) 연계를 위한 프로토타입 연구
- 기관 기록관리시스템 공개재분류 관련 기술 적용을 위한 사례연구
(출처 : 요약문 9p)
Abstract
▼
■ Final Research Goals
1. (Data Analysis) Automation mainly on accumulated public reclassification standards·Analysis of types and data for private information that can be intelligent
2. (Patterning private information) Derivation and patterning criteria for the 6 reclassification of electroni
■ Final Research Goals
1. (Data Analysis) Automation mainly on accumulated public reclassification standards·Analysis of types and data for private information that can be intelligent
2. (Patterning private information) Derivation and patterning criteria for the 6 reclassification of electronic records by non-public information(center of Article 9.1. no.6 of the Official Information Disclosure Act)
3. (Building learning data and test beds) Building public reclassification learning data and building test beds for continuous learning
■ Interim Findings
1. Analysis of types and data for private information
ㅇ "The National Archives public reclassification criteria* etc. completed the analysis of the data according to the type of non-public information target
* Production agency, title of records, record type, target record, undisclosed target information, public value and lake, etc.
ㅇ "Completed the analysis of the contents of the data and records according to the type of personal information.
2. Derivation and patterning of non-public information for the reclassification of electronic records (on Information Disclosure Act 9.1, No. 6)
ㅇ Basic pattern case study analysis used by S/W for commercially available personal information detection
ㅇ "Presenting and patterning standards applicable to record keeping standards, related materials, and case analysis
- Research on the form and pattern of the criteria for private information
- Performing training on the scope of non-public information, rules, and patterns for electronic documents and attached materials
ㅇ See the pattern being used * analysis of similar cases and other organizations
* Completed a similar study of personal information of institutions and public institutions using RMS public reclassification function
ㅇ "Presenting the criteria for the application of electronic records to the public reclassification and research on how to apply them
- Analyzing patterns and application cases according to the type of personal information by type of detail
3. Building public reclassification learning data and building test beds for continuous learning
ㅇ "Building a test bed for learning data verification tests for private information targets
- LINUX Server, Installation and conversion of work PCs, learners, and document filters
ㅇ "Automated public reclassification · Intelligent application test
- Automation for automatic filtering of private information targets ·Applying intelligent technology
- Various types of electronic records (Hangul, MS-OFFICE, PDF, etc.) application test.
ㅇ Learning data test for automatic filtering with patterns derived
- In the process of acquiring information and building learning data to improve the accuracy and suitability of non-public information
- Feedback on test results by type and pattern, accuracy tests and training data
ㅇ Linking "Prototyping research for future record management system(CAMS, RMS)
- Case study for application of technology related to public reclassification of institutional records management system is underwayFinal Research Goals
(출처 : SUMMARY 10p)
목차 Contents
- 표지 ... 1
- 최종보고서 ... 2
- 제 출 문 ... 3
- 목차 ... 4
- 표목차 ... 7
- 그림목차 ... 8
- I. 연구개발결과 요약문 ... 9
- 요약문 ... 9
- Summary ... 10
- II. 연구개발과제 연구결과 ... 11
- 제1장 연구 목표 ... 11
- 1.1. 연구배경 ... 11
- 1.2. 연구의 필요성 ... 11
- 1.3. 연구의 목표 ... 11
- 1.4. 주요 연구내용 ... 12
- 제2장 연구개발 내용 및 방법 ... 14
- 2.1. 선행연구 분석 ... 14
- 2.2. 유사사례 분석 ... 16
- 2.3. 테스트베드 설계/구축 ... 24
- 2.4. 분석모델 및 기계학습 ... 31
- 제3장 연구개발 완료 결과 ... 54
- 3.1. 테스트베드 구축 결과 ... 54
- 3.2. 문서필터 설치와 텍스트 변환 검증 결과 ... 57
- 3.3. 학습기/분석기 구축 결과 ... 61
- 3.4. 마스킹서버 설계 ... 68
- 제4장 연구결과 고찰 및 결론 ... 69
- 4.1. 연구결과의 고찰 ... 69
- 4.2. 연구고찰에 따른 결론 ... 70
- 제5장 최종 연구과제의 연구성과 ... 71
- 5.1. 활용성과 ... 71
- 5.2. 활용계획 ... 72
- 제6장 기타 주요변경 사항 ... 73
- 제7장 참고문헌 ... 74
- 제8장 첨부파일 ... 75
- 총괄 연구과제 요약 ... 79
- 끝페이지 ... 82
※ AI-Helper는 부적절한 답변을 할 수 있습니다.