국가기록물 검색고도화를 위한 검색시스템 및 검색기법 연구
연구책임자 염경록 연구참여자 염경록 외 10명
연구기간 2022- 04- 04 ~ 2022- 11- 30 분야 전자
발간등록번호 11-1741050-000090-01
국문요약 □ 연구목표 ◦ 국내·외 기록물관리기관 검색서비스 현황과 검색시스템 등 검색기법을 체계적으로 연구하여 대국민 국가기록물 검색시스템의 고도화 및 우수 검색기법 정립을 위한 기반 마련 □ 연구결과 ◦ 국내·외 기록물관리기관 등 포털 검색서비스 현황 연구 - 국내(서울기록원 등), 국외(TNA, NAA 등) 기록물관리기관 포털 검색서비스 현황 조사 - 국내는 서울기록원과 국외는 TNA의 기록물관리기관 포털 검색서비스 집중 분석 결과 도출 - 국가기록원의 문제점을 기반으로 다양한 관점에서의 검색서비스 비교를 통한 개선사항 도출 - 정보서비스 선진기관 현황 조사 및 집중 분석 결과 도출 ◦ 국가기록원 검색서비스(CAMS, 국가기록포털) 현황 분석 - 사용자 관점에서의 검색 품질 점검을 위해 정량·정성적 평가 체계 구축 - 국가기록원 검색서비스 사용자 관점에서의 검색 품질 점검 테스트 수행 - 시스템별, 검색메뉴별 동일용어 검색 테스트 수행 및 분석 결과 도출 - 철/건 메타데이터, 군·계열 기술서, 콘텐츠, 전거·시소러스에 대한 검색 테스트 및 분석 결과 도출 - CAMS에서 포털로 연계되는 데이터 필드에 대한 현황 분석 결과 도출 - CAMS에서 포털 검색서비스까지 주요 데이터 필드 매핑을 통한 연계 항목 도출 - 검색메뉴별 주요 연산자 및 필터링 기능 테스트 및 개선항목 도출 - 기록물 유형별 검색 테스트 및 개선항목 도출 - 고빈도/저결과 질의어에 대한 테스트 및 개선항목 도출 - CAMS와 포털의 색인어와 검색어 생성 기준(N-gram, 형태소, Stemming) 도출 - 일반적인 검색엔진에서 제공되는 기본 공통 기능을 조사하여 지원기능표 작성 - 지원기능표 기반 CAMS와 포털의 검색 기능 지원 여부 테스트 및 개선항목 도출 ◦ 국가기록원이 관리하는 데이터 분석을 통해 검색 효율화를 위한 관리 방안 및 서비스항목 정의 - 국가기록원과 협업을 통한 연계 구조에 대한 논리적 ERD 구성 - 국가기록원 관리 데이터 현황 분석 수행 - 검색테스트를 통해 자주 발생되는 데이터 오류 유형화 도출 - 통합 색인 설계방안 연구 및 통합 색인 설계안 도출 - 검색 효율화를 위한 통합 색인 스키마 구성 및 관리 방안 정의 - 선진 우수사례에서 도출한 서비스의 필요성 및 도입 가능성 연구 수행 - CAMS와 국가기록포털 서비스 사용자 및 사용자 친화적 서비스항목 정의 - 일반 사용자가 알기 어려운 용어 및 검색 기능 개선 방안 도출 ◦ 국가기록원 소장기록물 검색 효율화 및 우수 검색기법 방안 제시 - 개선방안 적용 테스트 및 품질 개선 효과 확인을 위한 검색 테스트 시범구축 수행 - 구축한 검색 테스트 사이트 대상 품질 평가 테스트 수행 - 검색 효율화를 위한 선행요건 검토 수행 - 검색 효율화를 위한 문제점 도출 및 해결 방안 모색 수행 - 검색 효율화를 위한 개선방향 적용 시 따르는 후속 효과 검토 수행 - 검색 Recall 개선을 위한 방안 제시 - 검색도구 간 연계 개선을 위한 방안 제시 - 검색 결과 화면 개선을 위한 방안 제시 - 검색 이력 통계 활용을 위한 방안 제시 - 최신 ICT 기술 활용을 통한 검색 효율화 개선방안 연구 수행 - 차세대 검색 시스템 개발을 위한 중장기 로드맵 안 작성 - 검색서비스 개선을 위한 예상 비용 산출을 위한 기초 자료 마련
영문요약 □ Research Goal ◦ A systematic study of search techniques such as search service status and search system of domestic and foreign records management institutions establishing the foundation for upgrading the national records search system and establishing excellent search techniques □ Research Scopes and Methods ◦ A Study on the Status of Portal Search Service such as Domestic and Foreign Archives Management Agencies - Survey on portal search services of records management institutions in Korea (Seoul Archives, etc.) and abroad (TNA, NAA, etc.) - Results of intensive analysis of portal search services of records management institutions such as Seoul Metropolitan Archives and TNA - Based on the problems of the National Archives of Korea, the comparison of search services from various perspectives to derive improvements - Survey on advanced information service organizations and derive intensive analysis results ◦ Analysis of the National Archives Search Service (CAMS, Portal) status - Establishment of a quantitative and qualitative evaluation system to check search quality from a user's perspective - Testing for quality checks from the user's perspective on the search service of the National Archives of Korea - Perform a comparative search test of the system and search menu for the same term and analyze the results - Perform search tests on metadata, group/series, contents, authority, thesaurus and analyze results - Analyze the current status of data fields linked to the Portal in CAMS to derive the current status of the association - Analyze major data fields from CAMS to portal search services to derive associated items - Test operators and filtering functions for each search menu to derive improvements - Perform search tests by type of archives to derive improvements - Perform search tests using high frequency and low result query to derive improvements - Analyze the indexing methods and search methods(N-gram, POS, Stemming) used by CAMS and portals to derive the current status - Investigate the basic functionality typically provided by the search engine to derive the current status - Based on the function support table, search functions supported by CMS and portal are tested to derive improvement items ◦ Define management plans and service items for search efficiency through data analysis managed by the National Archives of Korea - Create a logical ERD that connects cRMS to the portal through collaboration with the National Archives of Korea - Data status analysis managed by the National Archives of Korea - Derive the types of frequently occurring data errors through search test - Research on integrated index design plan and deriving an integrated index design - Define how to configure and manage the integrated index schema for search efficiency - Conducting a study on the necessity and availability of services derived from advanced best practices - Define CAMS and the National Archives Search Service User and User Friendly Service Items - Deriving ways to improve terms and search functions that are difficult for general users to understand - Definition of search items and return items in CAMS and the National Archives Search Service ◦ Proposal of improved search efficiency and excellent search technique for archives held by the National Archives of Korea - Construct search test pilot to check the improvement effect application test and quality improvement effect - Perform quality assessment tests on search test sites - Conducting a prerequisite review for search efficiency - Identifying problems and searching for solutions to improve search efficiency - Conducting follow-up effect review when applying improvement directions for search efficiency - Proposal of ways to improve search recall - Proposal of ways to improve linkage between search tools - Proposal of ways to improve the search result UI - Proposal of a plan for using search history statistics - Research on ways to improve search efficiency through the use of the latest ICT technology - Drafting a mid/long-term roadmap for the development of the next-generation search system - Prepare basic data for calculating estimated cost for search service improvement
