전체메뉴

전체메뉴 닫기

발간자료

  • Home
  • 업무안내·자료
  • 기록관리 자료실
  • 발간자료
R&D 연구보고서 상세
제목 문서 유형 보존포맷 및 장기보존패키지 다양화 연구
발간등록번호 11-1741050-000059-01
연구책임자 양동민 연구참여자
연구기간 2020- 04- 13 ~ 2020- 11- 30 분야 전자기록
첨부파일
국문요약
□ 연구목표
० 문서유형(텍스트, 스프레드시트, 프리젠테이션, 간행물 등) 보존포맷(문서보존포맷) 선정기준을 수립하고 권고 포맷을 제시하고, 폴더형 장기보존패키지 기술 규격 및 프로토타입 SW를 개발하고 검증하는 것을 목표로 함
□ 연구결과
० (문서-분석팀) 문서유형 전자기록 현황, 보존방식 및 장기보존 기관 사례 조사 및 분석­ 42개 공공기관을 대상으로 진행한 파일포맷 현황조사 내용을 분석하고, 유형별로 상위 5개 파일포맷 선정하였고, 국외 아카이브 기관 및 대학에서 보존포맷 현황 조사를 진행함
­ 42개 공공기관의 경우, 전자문서 유형에 해당하는 특정 파일포맷(e.g., HWP, DOC(X). PDF, PPT(X), XLS(X) 등)을 주로 보유함
० (문서-기준팀) 문서유형 보존포맷 선정기준 수립 및 권고 포맷 제시
­ 국내·외 주요 응용 프로그램(MS Office, 한컴오피스, LibreOffice, 구글 Docs)의 기능을 분석하고, 이를 기반으로 기능들을 재분류 및 계층화 작업을 수행하여 문서유형별 SP 및 선정기준(고유기준)을 도출함­ AHP(Analytic Hierarchy Process) 기법을 기반으로 고유기준별 가중치를 부여함
­० 위와 같은 과정을 토대로 문서유형 보존포맷 선정체계를 수립함
­० 보존포캣 선정체계의 평가방법으로 아래와 같이 문서유형 보존/수용가능포맷을 제시함
० (패키지-분석팀) 전자기록 장기보존패키지 조사 및 분석
­ 논리적 장기보존패키지에 대한 국내외 사례조사 및 장・단점 분석결과, CI와 PDI가 ‘하나의 파일’로 묶이면, 실제적 장기보존패키지, CI와 PDI가 별도의 파일로 존재하고 CI와 PDI가 식별자 등으로 연결할 수 있는 경우 논리적 장기보존패키지로 정의함
­० 파일형 및 폴더형 장기보존패키지에 대한 국내외 사례조사 및 장・단점 분석결과, 폴더형 장기보존패키지와 파일형 장기보존패키지는 모두 동일한 기능을 제공하지만 저장공간, 생성 및검증 시간, 장기적 이용 가능성 측면에서 모두 폴더형 장기보존패키지가 장점을 가지고 있음
­० 압축포맷 사례 조사 및 장단점 분석결과, ZIP 포맷이 가장 우수한 포맷으로 판단되며, 복구기능은 ZIP 파일포맷 표준에 위배되지 않도록 외부의 도구를 활용하는 방식이 적합함
०­ 국외 대표 아카이브 기관의 사례를 살펴본 결과, SIP(이관 패키지)와 AIP를 완전하게 다르게설계하는 것은 불필요하며, SIP와 AIP의 구조는 동일 또는 유사하게 설계하고 원칙 및 구현요구사항 등을 재설정하는 것이 바람직함
० (패키지-개발팀) 폴더형 장기보존패키지 기술규격 및 프로토타입 개발 및 검증
­० NEO3 2020년 10월 16일 제정: NAK 31-2: 2020(v1.0)「전자기록물 장기보존패키지 - 제2부:디렉토리로 구조화된 방식(NEO3)(v1.0)」
०­ NEO2 2020년 10월 16일 개정: NAK 31-1: 2020(v2.2)「전자기록물 장기보존패키지 – 제1부:XML로 포맷화된 방식(NEO2)(v2.2)」
­० NEO3를 기준으로 장기보존패키지 생성 프로토타입 설계 및 개발 완료
영문요약