전체메뉴

전체메뉴 닫기

발간자료

  • Home
  • 업무안내·자료
  • 기록관리 자료실
  • 발간자료
R&D 연구보고서 상세
제목 전자기록물 공개재분류를 위한 비공개정보 필터링 및 마스킹 기술 적용방안 연구
발간등록번호 11-1741050-000056-01
연구책임자 정기성 연구참여자
연구기간 2020- 04- 01 ~ 2020- 10- 30 분야 전자기록
첨부파일
국문요약
n 최종연구목표
1. (자료 분석) 축적된 공개재분류 기준서 등을 중심으로 자동화·지능화 할 수 있는 비공개 정보대상 유형 및 자료 분석
2. (비공개정보 패턴화) 전자기록물 공개재분류를 위한 비공개정보대상(정보공개법 제9조제1항제6호 중심) 기준 도출 및 패턴화
3. (학습데이터 및 테스트베드 구축) 공개재분류 학습데이터 구축 및 지속적 학습을 위한 테스트베드 구축
n 연구 결과물
1. 비공개정보대상 유형 및 자료 분석
ㅇ 국가기록원 공개재분류 기준서* 등을 참고하여 비공개정보대상 유형에 따른 자료 분석
* 생산기관, 기록물제목, 기록물유형, 대상기록, 비공개 대상정보, 공개 값 및 호수 등
ㅇ 개인정보유형*과 업무분류체계별 개인정보유형에 따른 자료와 기록물 상의 내용 비교 분석
* 일반정보(이름, 주민번호, 주소 등), 가족정보, 교육 및 훈련정보, 병역정보, 부동산 정보, 소득
정보, 기타 수익정보, 신용정보, 고용정보, 법적정보, 의료정보, 조직정보, 통신정보, 위치정보,
신체정보, 습관 및 취미정보
2. 전자기록물 공개재분류를 위한 비공개정보(정보공개법 제9조 제1항 제6호 중심) 기준 도
출 및 패턴화
ㅇ 시중 상용화 되어있는 개인정보 탐지용 S/W 등에서 사용하는 기본 패턴 사례연구분석
ㅇ 기록원 기준서 및 관련 자료, 사례 분석으로 적용 가능한 기준 제시 및 패턴화
- 비공개정보대상 기준 형태 및 패턴 연구(제6호 중심 – 개인정보유형별, 업무분류체계별)
- 전자문서 및 붙임자료에 대한 비공개대상정보 범위, 규칙, 패턴학습 수행
ㅇ 타기관 유사사례 및 활용중인 패턴* 분석 참조
* RMS 공개재분류 기능 사용기관 및 공공기관 개인정보 유사 연구 사례조사
ㅇ 전자기록물 공개재분류 적용 패턴 기준 제시* 및 적용 방안 연구
- 개인정보유형에 따른 패턴과 적용 사례를 유형별로 세부 기준 분석
* 개인정보유형 - 세부유형 - 패턴 형태 - 예시 - 실제 필터링 적용 등
3. 공개재분류 학습데이터 구축 및 지속적 학습을 위한 테스트베드 구축
ㅇ 비공개정보대상 학습데이터 검증 시험을 위한 테스트베드 구축
- Windows 서버, 작업용 PC, 학습기, 문서필터 설치 및 변환 완료
ㅇ 공개재분류 자동화·지능화 적용 시험
- 비공개정보대상 자동 필터링을 위한 자동화·지능화 기술 적용
- 전자기록물의 다양한 유형(한글, MS-OFFICE, PDF 등) 적용 시험
ㅇ 도출된 패턴으로 자동 필터링을 위한 학습데이터 시험
- 비공개대상정보 정확성 및 적합성 향상을 위한 정보 습득 및 학습데이터 구축
- 유형 및 패턴별 시험 결과, 정확도 테스트 및 학습데이터에 피드백
ㅇ 향후 기록물관리시스템(CAMS, RMS) 연계를 위한 프로토타입 연구
- 기관 기록관리시스템 공개재분류 관련 기술 적용을 위한 사례연구
영문요약
n Final Research Goals
1. (Data Analysis) Analysis of types and data of non-public information that can be automated
and intelligent based on accumulated public reclassification standards, etc.
2. (Patterning private information) Non-public information target for public reclassification of electronic records (centered on Article 9 (1) 6 of the Information Disclosure Act) and patterning
3. (Building learning data and test beds) Build public reclassified learning data and build a
test bed for continuous learning.
n Research Results
1. Analysis of types and data subject to non-public information
ㅇ Analyze data according to the type of non-public information subject by referring to the National Archives of Records Public Reclassification Standard
* Production institution, record title, record type, target record, non-public target information, public value and number, etc.
ㅇ Comparison and analysis of the contents of data and records according to personal information
type and personal information type by business classification system
2. Non-public information (centered on Article 9, Paragraph 1, No. 6 of the Information Disclosure Act) for public reclassification and patterning of electronic records
ㅇ Case study analysis of basic patterns used in commercially available personal information
detection S/W, etc.
ㅇ Presenting and patterning applicable standards through analysis of archives, related data, and
case studies
- Study on the standard form and pattern for non-public information (centered on No. 6-by personal information type, by business classification system)
- Conduct learning of the scope, rules, and patterns of non-disclosure target information for electronic documents and attached data.
ㅇ Reference cases of other organizations and analysis of patterns in use.
* Case study on reference research on personal information of RMS public reclassification
function users and public institutions.
ㅇ Suggestion of application pattern standards for public reclassification of electronic records
- Analysis of patterns and application cases according to types of personal information by type
* Personal information type-Detailed type-Pattern type-Example-Actual filtering applied, etc.
3. Building public reclassification learning data and building test beds for continuous learning
ㅇ Build public reclassified learning data and build a test bed for continuous learning
- Windows server, work PC, learner, document filter installation and conversion completed
ㅇ Public reclassification automation/intelligence application test
- Application of automation / intelligence technology for automatic filtering of non-public
information
- Application test for various types of electronic records (Korean, MS-OFFICE, PDF, etc.)
ㅇ Learning data test for automatic filtering with derived patterns
- Acquisition of information and construction of learning data to improve accuracy and
suitability of non-public target information
- Feedback on test results by type and pattern, accuracy test and learning data
ㅇ Prototype study for future records management system (CAMS, RMS) connection
- Case study for application of technology related to public reclassification of institutional records management system