본문으로 이동

모바일 전용 메뉴 호출

R&D연구보고서

웹기록물 아카이빙 기반기술 연구 및 적용 시험
연구책임자 정준선 연구참여자 4명
연구기간 2009- 03- 06 ~ 2009- 11- 30 분야 전자기록
발간등록번호 11-1311153-000096-01
첨부파일
국문요약 정보생산 및 정보제공의 중심으로서 웹사이트가 핵심적 역할을 하고 있으며, 특히 공공기관의 웹 사이트는 정부와 시민들 간에 주요 의사소통 및 정보 제공의 채널이 되고 있다. 이로 인해 국민들 은 시공간의 제약에서 벗어나 자유롭게 대정부 민원을 처리할 수 있게 되었을 뿐만 아니라 웹사이 트에서 운영하는 동호회, 포럼, 게시판 등에 자유롭게 참여하여 의사소통을 함으로써 시공간의 제 약에서 벗어나 사회적 연대감을 누릴 수 있게 되었다. 이러한 참여 및 의사소통 기록들은 한 시대 를 나타내는 중요한 기록 유산으로서 반드시 기록 보존되어야 한다. 본 연구에서는 지난해 연구에 이어 표면웹(Surface Web) 수집 고도화, Archivist를 위한 수집 통합 프로세스 연구 개발과 심층웹(Deep Web) 수집 및 보존을 위한 연구를 진행하였다. 웹기록물의 자동 수집을 위한 고도화된 지능형 웹크롤러 연구에서는 단순한 패턴 분석에 의한 URI 추출에 더하여 자바스크립트에 의해 동적으로 새성되는 URI를 추출하기 위한 연구로 다양한 분석 가능한 도구를 테스트하여 보고 이중 가장 적합한 모델을 적용하여 URI 분석의 정합성을 높 이는 연구를 진행하였다. 통합 프로세스 연구에서는 Archivist가 하베스팅 기술에 대한 깊이 있는 지식 없이도 원활하게 웹기록물을 수집 및 보존 처리 및 서비스를 하기 위한 일련의 업무 프로세스인 통합 프로세스를 연구하고 설계 및 개발을 통해 실제 수집에서 활용할 수 있도록 하였다. 또한 심층웹 기록물 수집,보존,서비스 기술 연구에서는 심층웹 기록물 아카이빙 사례 분석 및 관 련 기술 및 도구 연구와 국내 공공 기관의 웹사이트의 심층웹 기록물의 특성을 분석하여, 국내 공 공 기관에 적용 가능한 최적화 방법론을 설계하였다. 본 연구에서 개발된 내용을 통해 폐지 기관 또는 현재 운영중인 기관들을 대상으로 수집 테스트 및 분석을 통해 그 정합성 및 개선점들을 도출하였다.
영문요약 Today, web sites are playing an important role as a pivot that information is produced and pr ovided. Especially web sites of public institutions let the government able to communicate with the nation and to become a main channel that provides information for the nation. So the peopl e can request their civil application be processed out of temporal and spatial limitation and can have the feeling of social solidarity by participating in clubs, forums and bulletin boards, etc. o perated by the web sites. The record of these participations and communications should be pre served as important record heritages which present an age. As a continuation of last year’s research, this research includes enhancement of collection of surface web, R&D in comprehensive collection process for Archivist and research in collection and preservation of deep web, etc. In the research of the advanced intelligent web crawler for collecting web records automatica lly, we make an effort for enhancing the feasibility of URI analysis by testing various analytic tools and selecting the best model among them. With this, we can extract not only URIs by a simple pattern analysis but also URIs created dynamically by Javascript. We also research, design and develop comprehensive processes, that is, a series of business processes that allow Archivists to collect, preserve and serve web records smoothly without a deep knowledge of harvesting technology. So we let Archvists able to utilize these comprehens ive processes in collecting web records actually. We also have designed the optimal methodology applicable to the domestic public institution s, through case study, technology and tool research, and characteristics analysis of deep web r ecords of domestic public institutions with regard to archiving of deep web records Through collection test and analysis of the research output in the closed institutions or curre ntly operating institutions, its optimality and future improvement plan was drawn.
이전글 이미지데이터 활용을 위한 지능형 인식 라이브러리 연구
다음글 고문서 복제용 천연염료 및 관련시스템 개발