본문으로 이동

검색가이드

기록물 상세검색검색가이드

기록물 상세검색 조건을 서술하는 표입니다. 검색방식, 검생영역, 검색어설정, 생산기관, 생산연도, 공개구분, 원문서비스 ,기록물형태, 관리번호, 철건구분, 기록물구분, 목록건수 순으로 구성되어 있습니다.
검색방식	키워드검색 전후방일치검색 ※ 키워드 검색 : 문장 내 형태적 의미가 있는 단어만 검색 ※ 전후방일치검색 : 형태적 의미와 상관없이 모두 검색
검색영역	전체 기록물 제목 기록물 정보 기록물 정보 : 기록물 제목 외에 내용 요약, 명칭, 지명, 검색 키워드 영역 내에서 검색
검색어 설정	다음 단어 모두 포함 한자검색 포함 다음 문구 정확하게 포함 다음 단어 적어도 하나 포함 다음 단어 제외
생산기관	생산기관검색	생산연도 생산연도 두번째	~ 예) 1900~2010
공개구분	전체 공개 부분공개 비공개 공개에 한해서만 사본/열람신청이 가능합니다.
원문서비스	전체 온라인제공 온라인 미제공 온라인으로 원문제공이 가능한 기록물만 조회할 수 있습니다.
전자 / 비전자 구분	전체 전자 비전자
기록물형태	전체 일반문서 사진,필름류 녹음,동영상류 도면 카드류 국무회의록 정부간행물 일반도서 총독부간행물
관리번호	관리번호관리번호두번째 ~ 예) CM00020005	철건구분
기록물구분		목록건수
생산등록일자 생산등록일자 두번째	~ 예) 1900101~20100101	시행일자 시행일자 두번째	~ 예) 1900101~20100101

기록물 원문검색

기본검색

원문이미지를 제공하는 기록물들을 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

공공누리

원문이미지를 제공하는 기록물들을 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

토지기록물

일제강점기부터 정부수립 직후까지 생산된 토지 임야대장, 지적ㆍ임야원도 등 지적 기록물을 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

토지 기록물 검색 조건표
지명	시·군·구 등과 행정구역은 입력하지 마세요. 예)강화군(x)→강화
종류	전체 지적원도 임야원도 토지조사부 임야조사부 분배농지관련문서 사방사업관련문서 보안림
생산년도	~

관보

정부에서 발행한 관보를 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

관보검색 조건표
키워드	검색어 ※ 조선총독부 관보 검색시 에는 키워드를 한자로 변환 하여 입력해 주시기 바랍니다.
게제의뢰기관	기관검색
발행날짜	~
관보종류

국무회의록

국무회의록, 차관회의록, 안건철 등 국무회의 기록을 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

국무회의록검색 조건표
키워드	검색어
의안종별
회차	~
기록물 종류	전체 국무회의록 국무회의안건철 차관회의록 차관회의안건철 기타
시청각 종류	전체 동영상 녹취 사진 ※ 시청각기록물 검색시 체크하세요.

정부간행물

공공기관에서 발행한 간행물을 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

정부간행물검색 조건표
키워드	검색어
발행기관	발행기관명 기관검색
발행년도	발행년도 검색 시작년도발행년도 검색 종료년도 ~ 예) 1900~2010
간행물 유형	전체 연감.백서류 통계집 업무편람 법규집 사업보고서 교육자료 기관지 회의자료 목록류 사료연혁집 연구조사보고서 연설.강연집 전시.도감.화보집 기타(유형 미표시 기록물 포함)

독립운동 판결문

일제강점기 독립운동과 관련된 판결문을 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

독립운동 판결문 검색 조건표
키워드	검색어
이름/별명	이름/별명
판결기관	판결기관 기관검색
판결날짜	~

일제강점기 피해자명부

3.1운동 피살자, 관동대지진 피살자 명부를 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

일제강점기 피해자명부 검색 조건표
명부
성명	성명
등록시 본적지	등록시 본적지

일제강점기 건축도면

일제강점기에 지어진 학교, 형무소, 병원, 지방청사 등의 설계원도를 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

일제강점기 건축도면 검색 조건표
키워드	검색어
공사유형	전체 지적도 지형도 배치도 평면도 입면도 단면도 상세 건구표 꼬리표 분류표 도장 싸인 기타
도면종류	전체 지적도 지형도 배치도 평면도 입면도 단면도 상세 건구표 꼬리표 분류표 도장 싸인 기타
생산년도	~

일제강점기 기록물

정부에서 발행한 관보를 검색하실 수 있습니다.

단어와 단어를 조합하여 정확한 검색을 하고 싶을 때 :
“ ^ ” (Shift+6)를 사용 하세요.
단어와 단어를 조합하여 좀 더 폭넓게 검색하고 싶을 때 :
스페이스바를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ “” ”를 사용 하세요.
특정단어로 시작하는 단어가 포함된 문서를 검색하고 싶을 때 :
“ * ” (Shift+8)를 사용 하세요.
특정단어를 제외하고 검색하고 싶을 때 :
“ | ”를 사용 하세요.

일제강점기 기록물 검색 조건표
키워드
생산 년도	~
생산기관
분야선택	전체 지방행정 경무 외사 이재 사계 상공 경금속 연료 노무 학무 사회교육 건축회계 세무 위생 법무 지방행정 토지개량 수리조합 토목 임정 광무 미곡 산금 인사 편집 행형

R&D연구보고서

소장기록물 특성을 고려한 OCR 인식 성능 개선방안 연구
연구책임자	강지홍	연구참여자
연구기간	2020- 04- 01 ~ 2020- 11- 30	분야	전자
발간등록번호
첨부파일	2020-5 용역연구과제 최종보고서.pdf
국문요약	본 과제는 비전자기록물 중 타자기록물에 대하여 OCR 성능을 평가하고, OCR 성능을 개선하는 방안을 연구한다. 이를 위해서, 테스트베드에 3가지 OCR 모델(Lomin OCR, Tesseract, ABBYY)을 개발 및 구축하였다. 그리고, 타자기록물 1970장에 대한 이미지 파일과 Ground Truth 데이터를 가공하여 데이터셋화하였다. 이 중 394장을 임의 추출하여 평가데이터셋으로 지정하였다. 테스트베드에서는 GUI 툴을 활용해 본 데이터셋을 열람/수정/가감을 할 수 있다. 최근 OCR 모델을 딥러닝 기반으로 만드는 것이 인식 정확도 측면에서 유리하므로, Lomin OCR 모델은 딥러닝 모델 기반으로 타자기록물 학습데이터셋 1576장을 학습시켜 개발되었다. 결과적인 모델 성능은 Lomin OCR 이 E2E F1 score 기준으로 98.3%로 높은 정확도를 나타냈다. 타자기록물과 같이 일반적이지 않은 글자 형태에 대해서, 딥러닝 기반으로 특정 데이터셋에 대해 학습된 모델이 상용 솔루션 대비 더 우수한 성능을 보이는 것을 확인하였다. 위 성능은 공인시험 기관을 통해 확인되었다. 디지털화 프로세스 연구로, CAMS 내 비전자기록물 등록 시 OCR 적용 방안을 제시하였고, OCR 결과를 XML, PDF 파일 형태로 저장하고 수정할 수 있는 시스템을 제안하였다. OCR 결과로 생성된 PDF 파일을 검색 엔진에 제공하여 전문 검색, 키워드 추출, 색인 등록에 활용이 가능함을 확인하였다. 이를 위한 CAMS 내 시스템 기능 명세를 정의하여 시스템 개발에 필요한 구체적인 요건을 도출하였다. OCR 데이터셋 구축 효율화를 위한 특허를 출원하여 대규모 전사(Transcription) 작업 효율을 향상시킬 수 있는 방안을 제시하였다. OCR 결과를 활용한 딥러닝 기반의 문서 분류기와 단어간 관계 추출 방법을 제시하여, 소장기록물에 적용 시 기록물에 대한 정보 접근성을 제고할 수 있음을 확인하였다.
영문요약	This study focuses on evaluating accuracy of OCR models on typed archival documents and improving this accuracy by developing a deep-learning-based OCR model. On a testbed, three OCR models are installed; Lomin OCR, Tesseract, and ABBYY. The test set for evaluation is 394 images, which are randomly picked out of 1,970 typed archival documents. Ground truth word boxes are annotated on these images for training and evaluation. Testbed also supports adding/removing images and revising word boxes on the datasets through GUI. We applied deep learning techniques into Lomin OCR, which is trained against 1,576 images, and some other OCR datasets. Lomin OCR demonstrated high accuracy of F1 score 98.3%. We conclude that, for characters of atypical shape as in typed archival documents, target-trained model shows higher performance than general models. The official benchmark test was executed by a certified test agency. This study suggests how to integrate OCR engines into CAMS, and the desirable formats for archiving the OCR results. The PDF files produced by the OCR process can be input to the search engine, in order for full text search, keyword extraction, and indexing. We developed System Functional Requirement for suggested OCR capabilities. Regarding academic achievements, we published a patent application for boosting OCR dataset building processes. In addition, we suggested few-shot-based document classifier and word relation extraction based on OCR results, which can be applied to archival documents

목록

이전글	전자기록물 공개재분류를 위한 비공개정보 필터링 및 마스킹 기술 적용방안 연구
다음글	블록체인 트랜잭션과 스마트 컨트랙트 활용 기록관리 적용방안 연구