기록관리 AI 기술적용을 위한 공통 학습데이터 세트 구축 연구
연구책임자 오효정 연구참여자
연구기간 2021- 04- 01 ~ 2021- 10- 29 분야 전자
발간등록번호 11-1741050-000073-01
국문요약 ■ 최종연구목표 전자기록업무에 AI 기술 적용시 필요한 공통의 학습데이터를 구축하기 위한 체제 정립 및 유기적 활용 방안 연구 ■ 연구내용 및 방법 ○ 국내외 지능형 서비스 및 업무자동화 사례분석 - 국내외 기록관 서비스 현황 분석 - AI 기술 동향 및 학습데이터 구축 사례 분석 - 업무자동화 사례 분석 ○ 전자기록관리 프로세스 진단 및 데이터 구조화를 위한 관리조건 도출 - AI 기술 적용 업무에 대한 분석 - 공통 학습데이터 태깅 요소 도출 - 업무 효율화 및 서비스 개선 측면에서 실효성 있는 업무 영역 및 전자기록물 대상 선정 (연구 대상 업무영역 선정: 전거구축 지원, 분류/기술, 지능형검색 지원) ○ 전자적으로 생산된 전자문서 내 텍스트 정보 데이터화 - 학습데이터 구축 대상 전자기록물 선별 및 원시학습데이터 구축 방안 제시 - 공통 학습데이터를 위한 원시데이터셋 예제 ○ AI 기술 적용 및 서비스를 위한 공통 기초 학습데이터 파일럿 구축 - 공통 기초 학습데이터 파일럿 구축(학습데이터 구축 대상 기록물 선정: 경제기록물 생산기관별 4그룹 기록물 2,470철/10,049건 구축) - 학습데이터 검증 및 보완 ○ 구축된 공통 학습데이터 유기적 활용방안 제시 - 각 업무별 학습데이터 활용 결과를 재활용하는 선순환 체계 마련 - 구축된 학습데이터를 토대로 개발가능한 응용서비스 도출
영문요약 ■ Research goal A study on the establishment of system to construct common training dataset required for applying AI technology to electronic records management ■ Research scopes and methods ○ Case analysis of domestic and foreign intelligent service and business - Domestic and foreign archives services analysis - AI technology trends and training data construction cases - RPA(Robotic Process Automation cases ○ Electronic records management process analysis - AI technology application task analysis - Derivation of common training dataset elements - Selection of effective target tasks and electronic records ○ Text data extraction from electronic records born digital - Suggestion for building raw data for training corpus - Examples of raw data for training corpus ○ Pilot construction of common training dataset required for applying AI technology - Pilot construction of common training dataset - Verification of common training dataset ○ Suggestion a plan to utilize the common training dataset - Establishing a feedback system based on recycling results of learning data - Deriving application that can be developed based on the training dataset
