본문으로 이동

모바일 전용 메뉴 호출

R&D연구보고서

전자기록물 공개재분류를 위한 비공개정보 필터링 및 마스킹 기술 적용방안 연구
연구책임자 정기성 연구참여자
연구기간 2020- 04- 01 ~ 2020- 10- 30 분야 전자기록
발간등록번호 11-1741050-000056-01
첨부파일
국문요약 n 최종연구목표 1. (자료 분석) 축적된 공개재분류 기준서 등을 중심으로 자동화·지능화 할 수 있는 비공개 정보대상 유형 및 자료 분석 2. (비공개정보 패턴화) 전자기록물 공개재분류를 위한 비공개정보대상(정보공개법 제9조제1항제6호 중심) 기준 도출 및 패턴화 3. (학습데이터 및 테스트베드 구축) 공개재분류 학습데이터 구축 및 지속적 학습을 위한 테스트베드 구축 n 연구 결과물 1. 비공개정보대상 유형 및 자료 분석 ㅇ 국가기록원 공개재분류 기준서* 등을 참고하여 비공개정보대상 유형에 따른 자료 분석 * 생산기관, 기록물제목, 기록물유형, 대상기록, 비공개 대상정보, 공개 값 및 호수 등 ㅇ 개인정보유형*과 업무분류체계별 개인정보유형에 따른 자료와 기록물 상의 내용 비교 분석 * 일반정보(이름, 주민번호, 주소 등), 가족정보, 교육 및 훈련정보, 병역정보, 부동산 정보, 소득 정보, 기타 수익정보, 신용정보, 고용정보, 법적정보, 의료정보, 조직정보, 통신정보, 위치정보, 신체정보, 습관 및 취미정보 2. 전자기록물 공개재분류를 위한 비공개정보(정보공개법 제9조 제1항 제6호 중심) 기준 도 출 및 패턴화 ㅇ 시중 상용화 되어있는 개인정보 탐지용 S/W 등에서 사용하는 기본 패턴 사례연구분석 ㅇ 기록원 기준서 및 관련 자료, 사례 분석으로 적용 가능한 기준 제시 및 패턴화 - 비공개정보대상 기준 형태 및 패턴 연구(제6호 중심 – 개인정보유형별, 업무분류체계별) - 전자문서 및 붙임자료에 대한 비공개대상정보 범위, 규칙, 패턴학습 수행 ㅇ 타기관 유사사례 및 활용중인 패턴* 분석 참조 * RMS 공개재분류 기능 사용기관 및 공공기관 개인정보 유사 연구 사례조사 ㅇ 전자기록물 공개재분류 적용 패턴 기준 제시* 및 적용 방안 연구 - 개인정보유형에 따른 패턴과 적용 사례를 유형별로 세부 기준 분석 * 개인정보유형 - 세부유형 - 패턴 형태 - 예시 - 실제 필터링 적용 등 3. 공개재분류 학습데이터 구축 및 지속적 학습을 위한 테스트베드 구축 ㅇ 비공개정보대상 학습데이터 검증 시험을 위한 테스트베드 구축 - Windows 서버, 작업용 PC, 학습기, 문서필터 설치 및 변환 완료 ㅇ 공개재분류 자동화·지능화 적용 시험 - 비공개정보대상 자동 필터링을 위한 자동화·지능화 기술 적용 - 전자기록물의 다양한 유형(한글, MS-OFFICE, PDF 등) 적용 시험 ㅇ 도출된 패턴으로 자동 필터링을 위한 학습데이터 시험 - 비공개대상정보 정확성 및 적합성 향상을 위한 정보 습득 및 학습데이터 구축 - 유형 및 패턴별 시험 결과, 정확도 테스트 및 학습데이터에 피드백 ㅇ 향후 기록물관리시스템(CAMS, RMS) 연계를 위한 프로토타입 연구 - 기관 기록관리시스템 공개재분류 관련 기술 적용을 위한 사례연구
영문요약 n Final Research Goals 1. (Data Analysis) Analysis of types and data of non-public information that can be automated and intelligent based on accumulated public reclassification standards, etc. 2. (Patterning private information) Non-public information target for public reclassification of electronic records (centered on Article 9 (1) 6 of the Information Disclosure Act) and patterning 3. (Building learning data and test beds) Build public reclassified learning data and build a test bed for continuous learning. n Research Results 1. Analysis of types and data subject to non-public information ㅇ Analyze data according to the type of non-public information subject by referring to the National Archives of Records Public Reclassification Standard * Production institution, record title, record type, target record, non-public target information, public value and number, etc. ㅇ Comparison and analysis of the contents of data and records according to personal information type and personal information type by business classification system 2. Non-public information (centered on Article 9, Paragraph 1, No. 6 of the Information Disclosure Act) for public reclassification and patterning of electronic records ㅇ Case study analysis of basic patterns used in commercially available personal information detection S/W, etc. ㅇ Presenting and patterning applicable standards through analysis of archives, related data, and case studies - Study on the standard form and pattern for non-public information (centered on No. 6-by personal information type, by business classification system) - Conduct learning of the scope, rules, and patterns of non-disclosure target information for electronic documents and attached data. ㅇ Reference cases of other organizations and analysis of patterns in use. * Case study on reference research on personal information of RMS public reclassification function users and public institutions. ㅇ Suggestion of application pattern standards for public reclassification of electronic records - Analysis of patterns and application cases according to types of personal information by type * Personal information type-Detailed type-Pattern type-Example-Actual filtering applied, etc. 3. Building public reclassification learning data and building test beds for continuous learning ㅇ Build public reclassified learning data and build a test bed for continuous learning - Windows server, work PC, learner, document filter installation and conversion completed ㅇ Public reclassification automation/intelligence application test - Application of automation / intelligence technology for automatic filtering of non-public information - Application test for various types of electronic records (Korean, MS-OFFICE, PDF, etc.) ㅇ Learning data test for automatic filtering with derived patterns - Acquisition of information and construction of learning data to improve accuracy and suitability of non-public target information - Feedback on test results by type and pattern, accuracy test and learning data ㅇ Prototype study for future records management system (CAMS, RMS) connection - Case study for application of technology related to public reclassification of institutional records management system
이전글 2019년 국가기록관리·활용기술 연구개발(R&D) 사업 자체연구 결과보고서(총 2건)
다음글 소장기록물 특성을 고려한 OCR 인식 성능 개선방안 연구