본문 바로가기

it용어

디지털 아카이브(Digital Archive)

문화유산 및 아날로그 정보를 디지털화해 모아 놓은 시스템 또는 디지터상에 조성된 데이터 저장고.

 

디지털 아카이브(digital archive)는 시간 경화에 의해 질이 떨어지거나 소실될 우려가 있는 데이터를 장기 보존하려는 데 목적이 있다. 

 

물리 형태의 기록물은 안정적인 보존이 가장 중요하다. 전산화된 자료라 해도 원본 자료는 고유성을 띠여 , 손실시 대체가 불가능하다. 일반적인 사유로는 열람이 금지되는 편이다. 반면 디지털 아카이브는 데이터 보존 못지않게 접근 및 사용에도 중점을 둔다. 따라서 검색과 활용이  쉽게 이루어지고, 사용자 목적에 맞게 원본을 다시 변형할 수 있다. 특히 공공 아카이브는 여러 사람의 참여로 만들어지기 때문에 내용이 지속적으로 활장되며, 강한 개방성과 공공성을 띤다.

 

인터넷에서 생성되는 수많은 기록물도 영구적이지 않다. 2019년 불거진 싸이원드 서비스 중단 문제가 대표 사례다. 이 같은 문제를 방지하기 위해 필요한 기술도 웹 아카이브(web archive)다. 웹사이트 전체 또는 일부를 크롤링(crawling)해서 아케이브를 생성하면 사이트가 삭제되더라고 내용을 보존할 수 있다.

 

미국은 1996년부터 인터넷 아카이브 프로젝트를  추진해 왔는데 전 세계 웹사이트를 수집,보관해 기록하ㅗㄱ 있따. 국내에서는 2004년부터 국립중앙도서관이 '오아시스' 프로젝트를 운영하고 있다.  여기서 시간이 흘러 없어진 우리나라 주요 웹사이트 모습을 찾아볼 수 있다. 그러나 공개된 웹 자료 수량은 적고 선정 웹사이트 기준은 열려져 있지 않다. 공공성이 높고 가치 있는 웹사이트는 유형별로 구분하고 정기적인 아카이비잉 필요하다는 목소리가 높아지고 있다. 

 

통상 데이터 백업과 아카이브를 같은 의미로 사용하는 경우가 있지만 이 둘은 엄연히 다른 용어다. 백업을 사고 발생 시 복구를 위해 특정 시점데이터를 모두 사본화한 저장물이다. 이에 따라 시가닝 지나면 원본과는 차이가 난다. 아카이빙은 원본 자체를 저장하고 관리하기 때문에 게속 원본 속성을 유지한다는 특징이 있다.

 출처]
한국정보통신기술협회(최신 ICT 시사상식2021): 디지털 아카이브

'it용어' 카테고리의 다른 글

오픈 API(Open Api)  (0) 2022.01.08
아두이노(Arduino)  (0) 2021.12.25
데이터 3법  (0) 2021.12.11
기계독해(Machine Reading Comprehension, MRC)  (0) 2021.11.27
개방형 오픈 접속망(Open-RAN)  (0) 2021.11.20