디지털시청각물 보존포맷 설계 및 변환기술 연구
연구책임자 유병문 연구참여자 8명
연구기간 2013- 06- 27 ~ 2013- 11- 30 분야 시청각물
발간등록번호 11-1312125-000015-01
국문요약 디지털 콘텐츠는 부호, 문자, 음성, 음향, 영상 정보 등을 디지털 포맷으로 가공 처리한 정보 자 원으로 크게 아날로그로 생산된 이력없이 처음부터 디지털로 생산된 것(born digital)과 아날로그 형 태의 자원이 디지털 포맷으로 변환된 것(digitization)을 모두 포함한다. 이 디지털 콘텐츠는 공간을 초월한 접근성, 배포의 용이성, 그리고 즉시성 등의 강력한 장점이 있지만, 디지털 콘텐츠를 정보자 원의 한 부분으로 유지 관리하기 위해서는 휘발성과 기술의존성과 같은 문제점들이 유발된다. 그러 므로 장기적인 관점에서 정보자원을 유지 관리하여 서비스하고 후대까지 보존해서 전달하는 보관 및 서비스 측면에서는 디지털 콘텐츠의 장기적인 보존은 매우 중요하다. 시청각 기록물의 장기보존을 위한 본 연구는 다음 세 가지의 목표를 가지고 수행되었다. 1) 디지털 시청각 기록물 장기보존을 위한 표준 포맷 연구 2) 디지털 시청각기록물 보존 포맷 변환 시스템에 관한 연구 3) 디지털 시청각물 보존포맷변환 테스트베드 설계 및 구현 본 연구의 성공적인 수행을 위해, 해외에서 적용 또는 연구 중인 해외 사례 조사, 포맷 변환 소프트 웨어 등을 조사하여 디지털 시청각 기록물의 표준 보존포맷에 대한 연구, 장기보존 파일의 무결성 확 인 사례, 디지털 시청각기록물 장기보존 포맷 변환 시스템에 관한 연구 등을 수행하였다. 또한 시청각 물(영상, 오디오, 비디오 파일)을 장기보존하기 위한 보존 포맷, 보존포맷으로 변환된 파일의 무결성을 확인하는 무결성 알고리즘, 이들을 테스트하기 위한 테스트베드 시스템을 개발하였다. 테스트베드 시스 템은 하드웨어에 의존함이 없이 오직 소프트웨어 라이브러리만으로 구성이 되었으며, 소프트웨어는 모 두 무료 공개 소프트웨어(FFmpeg, OpenCV, ImageMagick)를 사용했다. 영상 보존포맷으로는 TIFF 포 맷을, 오디오와 비디오의 컨테이너로는 MKV 포맷을, 오디오 보존포맷으로는 FLAC, 비디오 보존포맷으 로는 FFV1 포맷을 선정했다. 원본 파일과 보존포맷 파일간의 내용의 무결성을 증명하기 위한 알고리 즘은 SHA-2 알고리즘을 구현했다. 본 연구를 통해 개발된 시스템은 Windows 7 시스템과 nVidia사의 GPU 시스템으로 구성된 하드웨 어, OpenCV 영상처리 라이브러리, 마이크로소프트(MicroSoft)사의 Visual Studio 개발 툴, 노키아 (Nokia)사의 Qt 툴 등으로 구성되었다. 보존포맷으로의 변환 실험은 많이 사용되어 지고 있는 7 영상 포맷, 11 오디오포맷, 7 비디오포맷을 사용하여 수행되었으며, 100% 변환율을 보였다.
영문요약 Digtial contents are information resources transformed in digital formats such as sign, character, voice, sound, image, and video. And it can be grouped of two categories: “born digital” and “digitized” contents. The term “born-digital” refers to materials that originate in a digital form and does not have an analogue equivalent, either as the originating source or as a result of conversion to analogue form. Digitized contents are digitized from analog materials. Digital contents have good characteristics such accessibility over space, easiness for distribution, and instantaneity. However, they are hardware/software technology dependent and volatile, which make difficult the digital contents to be managed as a part of information resources. Therefore, preserving the digital contents for a long-term use is very important for future generation. and serve them in the future The purposes of the research for a long-term preservation of visual/audial documentaries are as follows: 1) research on long-term preservation format for digital visual/audial documentaries 2) research on preservation format conversion system for digital visual/audial documentaries 3) implementation of test-bed system for the preservation format conversion system Through this project, the abroad on-going and performed projects; the existing format transcoding softwares; preservation formats for image, audio, and video file; fixity checking algorithms; format conversion system for long-term preservation are surveyed. As a result of this research, A test-bed format conversion system is developed: it includes long-term preservation formats for visual/audial materials, an algorithm to check conversion fixity, and save log information for the conversion. The long-term preservation formats are determined to cover most of current codec and formats: TIFF for image, MKV container format for audio and video, FLAC for audio encoding/decoding, and FFV1 for video encoding/decoding. a SHA-2 cryptographic hash function is implemented for fixity checking. The test-bed system format conversion system is implemented only using open software libraries(FFmpeg, OpenCV, ImageMagick) to be independent to any hardware system. The system was implemented on Windows 7, using Qt software development environment kit, and Microsoft’s visual studio 2010, and tested against 7 image formats, 11 audio formats, and 7 video formats with 100% conversion results.
