웨이백 머신
| Wayback Machine | |
|---|---|
| 파일:Wayback Machine logo 2010.svg | |
| 영리여부 | 비영리 |
| 사이트 종류 | 인터넷 아카이브 |
| 회원 가입 | 필요 없음 |
| 사용 언어 | 영어 |
| 시작일 | 2001년 10월 24일 |
| 웹사이트 |
|
| 현재 상태 | 운영 중 |
웨이백 머신(Wayback Machine)은 인터넷 아카이브가 만든 디지털 타임캡슐이다. 알렉사 인터넷의 콘텐츠와 함께 유지되고 있다. "3차원 인덱스"라고 불리는 이 아카이브에서 사용자는 시간을 초월해 보존된 웹 페이지를 볼 수 있다.
보존한 웹페이지는 저장된지 6~12개월 이후에 공개된다. 저장하는 주기가 다르기 때문이다. 모든 업데이트에 웹사이트를 추적해 기록하는 것은 아니지만 몇 주 간격으로 저장한다.
개요
웨이백 머신은 공익적 디지털 보존을 목표로 하는 비영리 프로젝트로, 웹의 역사와 문화를 장기적으로 보존해 누구나 무료로 접근할 수 있도록 한다. 개별 URL의 과거 스냅샷을 연도·월·일 기준으로 제공하며, 사용자는 특정 시점의 사이트 레이아웃과 텍스트·이미지 등 정적 자원을 확인할 수 있다. 자동 크롤링 외에도 이용자가 직접 보존을 요청할 수 있는 "Save Page Now" 기능을 제공한다.
역사
인터넷 아카이브의 설립자 브루스터 케일과 브루스 길리엇(Bruce Gilliat)은 웹사이트의 내용이 변화나 종료로 인해 사라지는 것을 해결하고자 2001년 10월 24일 웨이백 머신을 런칭하였다.[2] 출시 이후 도서관·박물관·학계와의 협력, 기부 및 자원봉사 기반의 인프라 확장을 통해 수집 범위와 재생 품질을 지속적으로 개선해 왔다.
성장
| Wayback Machine by Year | Pages Archived |
|---|---|
| 2004 | 30,000,000,000(0-100B : Light blue)
|
| 2005 | 40,000,000,000
|
| 2008 | 85,000,000,000
|
| 2012 | 150,000,000,000(100B-450B : Yellow)
|
| 2013 | 373,000,000,000
|
| 2014 | 400,000,000,000
|
| 2015 | 452,000,000,000(450B-600B : Orange)
|
| 2016 | 459,000,000,000
|
| 2017 | 279,000,000,000
|
| 2018 | 310,000,000,000
|
| 2019 | 345,000,000,000
|
| 2020 | 405,000,000,000
|
| 2021 | 514,000,000,000
|
| 2022 | 640,000,000,000(600B- : Red)
|
| 2024 | 866,000,000,000
|
기능
- URL 기반 탐색 : 주소창에 URL을 입력하면 연도별 캘린더와 스냅샷(저장 시점) 목록이 제공된다.
- 캘린더/타임라인 보기 : 특정 날짜를 선택해 그 시점의 정적 페이지를 재생(Replay)한다.
- 변경 내역 비교 : 일부 페이지는 서로 다른 날짜의 스냅샷 간 차이를 비교(Changes)할 수 있다.
- Save Page Now : 누구나 URL을 제출해 즉시 아카이브를 요청할 수 있다. (일부 옵션은 외부 링크·에러 페이지·스크린샷까지 보존)
- 외부 링크 추적 : 저장 시 해당 페이지에서 연결된 링크(Outlinks)를 함께 크롤링하도록 선택할 수 있다.
- 컬렉션/시드 관리 : 기관·연구 프로젝트 단위로 특정 주제의 URL 묶음(컬렉션)을 만들어 수집·열람할 수 있다.
- API/프로토콜 : Memento(TimeMap/TimeGate) 등 표준화된 방식으로 스냅샷 존재 여부와 목록을 조회할 수 있다.
- 브라우저 확장/도구 : 크롬·파이어폭스 등 확장을 통해 끊어진 링크에 대한 보존본을 빠르게 열 수 있다.
작동 원리
웨이백 머신은 크롤러(대표적으로 Heritrix 등)를 이용해 공개 웹을 주기적으로 수집하고, 수집한 결과를 WARC(Web ARChive) 형식으로 저장한다. 저장된 각 항목은 (1) URL, (2) 수집 시간(타임스탬프), (3) HTTP 응답 및 정적 리소스(HTML·이미지·CSS 등)로 구성된다. 재생 시에는 상대 경로 재작성, 중복 제거, 압축 해제 등을 거쳐 당시의 화면을 최대한 복원한다. 다만 로그인·결제 벽 뒤의 콘텐츠나 클라이언트 측 자바스크립트로 동적으로 불러오는 데이터는 수집·재생이 제한될 수 있다.
수집 정책 및 제외
- 주기 및 범위 : 모든 페이지가 동일 주기로 저장되지는 않으며, 사이트·인기·로봇 배제 설정 등에 따라 빈도와 범위가 달라진다.
- robots.txt/소유자 요청 : 웹사이트의 robots.txt 정책이나 정당한 소유자 요청, 법적 사유에 따라 열람이 제한되거나 제거될 수 있다.
- 지연 공개 : 기본 크롤링으로 수집된 항목은 내부 처리·검증 과정 때문에 일정 기간(문헌상 수개월) 후 공개될 수 있다. 반면 Save Page Now로 제출된 개별 URL은 즉시 또는 짧은 지연 후 공개되는 경우가 있다.
한계와 주의 사항
- 동적 콘텐츠 : API 호출, 로그인 필요 영역, 실시간 데이터, DRM·스트리밍 등은 완전 재현이 어렵다.
- 불완전 자원 : 원본 서버의 리소스 일부(폰트·스크립트 등)가 누락되면 레이아웃이 깨질 수 있다.
- 정확성/신뢰성 : 스냅샷은 당시 서버 응답을 저장한 것으로, 원본 페이지의 의도·맥락을 모두 보장하지는 않는다.
- 법적 위험 : 개인정보·저작권 이슈가 있는 자료를 무단 재게시·확산하는 행위는 각국 법제의 적용을 받을 수 있다.
법적 활용과 신뢰도
언론·연구·소송 등에서 과거 웹 페이지의 증거 보존 또는 검증 용도로 활용된다. 다만 스냅샷의 타임스탬프와 헤더는 기술적 기록일 뿐, 공적 공증이나 법원의 인증과 동일한 효력을 자동으로 부여하지는 않는다. 사법적 증거로 제출할 경우에는 수집 경위·무결성·연계성 등에 대한 추가 소명이 요구될 수 있다.
접근성 및 도구
- 접근 경로 : web
.archive .org / archive .org /web / web .archive .org /save - 우회/검열 회피 : 토르 네트워크용 주소(위 인포박스의 Onion URL)를 통해 제한 환경에서도 접속할 수 있다.[5]
- 개발자 : TimeMap/TimeGate 등 표준 API를 통해 특정 URL의 스냅샷 목록 조회, 가장 가까운 시점의 캡처 탐색을 자동화할 수 있다.
사용 방법
위 주소 중 하나에 아카이브할 주소를 넣는다.
스마트폰에서 아카이브할 경우 PC 버전 페이지 주소를 넣어도 자동으로 모바일 버전 페이지가 아카이브 된다. 스마트폰에서 PC 버전 페이지로 저장하려고 할 경우 크롬 등 웹 브라우저에서 "데스크톱 사이트(Desktop site)" 모드로 해야한다.
"데스크톱 사이트" 모드일 경우 디시인사이드 갤러리처럼 모바일 주소를 넣어도 자동으로 PC 버전으로 저장되는 사이트도 있지만, 인벤처럼 모바일 주소를 넣으면 모바일 버전으로 저장하는 사이트도 있다. 스마트폰에서도 확실히 PC 버전으로 저장하고 싶으면 "데스크톱 사이트" 모드에 PC 버전 주소를 넣는 게 낫다.
추가 팁:
- Save Page Now 제출 시 save outlinks(연결 문서 동시 보존) 옵션을 활용하면 링크 소실에 대비할 수 있다.
- 스냅샷이 너무 많을 때는 Changes 기능으로 특정 기간의 변경만 비교해 확인한다.
- 재생 화면이 깨질 경우, 차단된 외부 리소스가 원인일 수 있으므로 다른 날짜의 스냅샷을 시도하거나 텍스트만 확인한다.
대안 및 비교
- archive.today — 수동 보존 중심, 단일 스냅샷·렌더링에 강점
- Perma.cc — 학계·법조계용 영구 링크 서비스
- 국립·대학 도서관의 웹 아카이빙 프로젝트 — 기관별 주제 컬렉션 운영
같이 보기
각주
- ↑ https://github.com/yt-dlp/yt-dlp/issues/9707
- ↑ Notess, Greg R. (March–April 2002). “The Wayback Machine: The Web's Archive”. 《Online》 26: 59–61 – EBSCOhost 경유.
- ↑ michelle (2014년 5월 9일). “Wayback Machine Hits 400,000,000,000!”. Internet Archive. 2014년 8월 26일에 원본 문서에서 보존된 문서. 2015년 3월 25일에 확인함.
- ↑ “Internet Archive”. Internet Archive. 2020년 12월 31일에 원본 문서에서 보존된 문서. 2021년 3월 8일에 확인함.
- ↑ 위 인포박스의 주석 참조.
외부 링크
- 모듈:Official_website 90번째 줄에서 Lua 오류: attempt to index field 'wikibase' (a nil value).
- 스크립트 오류가 있는 문서
- 잘못된 파일 링크가 포함된 문서
- 위키데이터 속성 P18을 사용하는 문서
- 위키데이터 속성 P41을 사용하는 문서
- 위키데이터 속성 P94를 사용하는 문서
- 위키데이터 속성 P117을 사용하는 문서
- 위키데이터 속성 P154를 사용하는 문서
- 위키데이터 속성 P213을 사용하는 문서
- 위키데이터 속성 P227을 사용하는 문서
- 위키데이터 속성 P242를 사용하는 문서
- 위키데이터 속성 P244를 사용하는 문서
- 위키데이터 속성 P245를 사용하는 문서
- 위키데이터 속성 P268을 사용하는 문서
- 위키데이터 속성 P269를 사용하는 문서
- 위키데이터 속성 P271을 사용하는 문서
- 위키데이터 속성 P347을 사용하는 문서
- 위키데이터 속성 P349를 사용하는 문서
- 위키데이터 속성 P350을 사용하는 문서
- 위키데이터 속성 P373을 사용하는 문서
- 위키데이터 속성 P380을 사용하는 문서
- 위키데이터 속성 P396을 사용하는 문서
- 위키데이터 속성 P409를 사용하는 문서
- 위키데이터 속성 P428을 사용하는 문서
- 위키데이터 속성 P434를 사용하는 문서
- 위키데이터 속성 P435를 사용하는 문서
- 위키데이터 속성 P436을 사용하는 문서
- 위키데이터 속성 P454를 사용하는 문서
- 위키데이터 속성 P496을 사용하는 문서
- 위키데이터 속성 P549를 사용하는 문서
- 위키데이터 속성 P650을 사용하는 문서
- 위키데이터 속성 P651을 사용하는 문서
- 위키데이터 속성 P691을 사용하는 문서
- 위키데이터 속성 P716을 사용하는 문서
- 위키데이터 속성 P781을 사용하는 문서
- 위키데이터 속성 P791을 사용하는 문서
- 위키데이터 속성 P864를 사용하는 문서
- 위키데이터 속성 P865를 사용하는 문서
- 위키데이터 속성 P886을 사용하는 문서
- 위키데이터 속성 P902를 사용하는 문서
- 위키데이터 속성 P906을 사용하는 문서
- 위키데이터 속성 P947을 사용하는 문서
- 위키데이터 속성 P950을 사용하는 문서
- 위키데이터 속성 P966을 사용하는 문서
- 위키데이터 속성 P982를 사용하는 문서
- 위키데이터 속성 P1003을 사용하는 문서
- 위키데이터 속성 P1004를 사용하는 문서
- 위키데이터 속성 P1005를 사용하는 문서
- 위키데이터 속성 P1006을 사용하는 문서
- 위키데이터 속성 P1015를 사용하는 문서
- 위키데이터 속성 P1045를 사용하는 문서
- 위키데이터 속성 P1048을 사용하는 문서
- 위키데이터 속성 P1053을 사용하는 문서
- 위키데이터 속성 P1146을 사용하는 문서
- 위키데이터 속성 P1153을 사용하는 문서
- 위키데이터 속성 P1157을 사용하는 문서
- 위키데이터 속성 P1186을 사용하는 문서
- 위키데이터 속성 P1225를 사용하는 문서
- 위키데이터 속성 P1248을 사용하는 문서
- 위키데이터 속성 P1273을 사용하는 문서
- 위키데이터 속성 P1315를 사용하는 문서
- 위키데이터 속성 P1323을 사용하는 문서
- 위키데이터 속성 P1330을 사용하는 문서
- 위키데이터 속성 P1362를 사용하는 문서
- 위키데이터 속성 P1368을 사용하는 문서
- 위키데이터 속성 P1375를 사용하는 문서
- 위키데이터 속성 P1407을 사용하는 문서
- 위키데이터 속성 P1556을 사용하는 문서
- 위키데이터 속성 P1584를 사용하는 문서
- 위키데이터 속성 P1695를 사용하는 문서
- 위키데이터 속성 P1707을 사용하는 문서
- 위키데이터 속성 P1736을 사용하는 문서
- 위키데이터 속성 P1886을 사용하는 문서
- 위키데이터 속성 P1890을 사용하는 문서
- 위키데이터 속성 P1907을 사용하는 문서
- 위키데이터 속성 P1908을 사용하는 문서
- 위키데이터 속성 P1960을 사용하는 문서
- 위키데이터 속성 P1986을 사용하는 문서
- 위키데이터 속성 P2041을 사용하는 문서
- 위키데이터 속성 P2163을 사용하는 문서
- 위키데이터 속성 P2174를 사용하는 문서
- 위키데이터 속성 P2268을 사용하는 문서
- 위키데이터 속성 P2349를 사용하는 문서
- 위키데이터 속성 P2418을 사용하는 문서
- 위키데이터 속성 P2456을 사용하는 문서
- 위키데이터 속성 P2484를 사용하는 문서
- 위키데이터 속성 P2558을 사용하는 문서
- 위키데이터 속성 P2750을 사용하는 문서
- 위키데이터 속성 P2980을 사용하는 문서
- 위키데이터 속성 P3223을 사용하는 문서
- 위키데이터 속성 P3233을 사용하는 문서
- 위키데이터 속성 P3348을 사용하는 문서
- 위키데이터 속성 P3372를 사용하는 문서
- 위키데이터 속성 P3407을 사용하는 문서
- 위키데이터 속성 P3430을 사용하는 문서
- 위키데이터 속성 P3544를 사용하는 문서
- 위키데이터 속성 P3562를 사용하는 문서
- 위키데이터 속성 P3563을 사용하는 문서
- 위키데이터 속성 P3601을 사용하는 문서
- 위키데이터 속성 P3723을 사용하는 문서
- 위키데이터 속성 P3788을 사용하는 문서
- 위키데이터 속성 P3829를 사용하는 문서
- 위키데이터 속성 P3863을 사용하는 문서
- 위키데이터 속성 P3920을 사용하는 문서
- 위키데이터 속성 P3993을 사용하는 문서
- 위키데이터 속성 P4038을 사용하는 문서
- 위키데이터 속성 P4055를 사용하는 문서
- 위키데이터 속성 P4114를 사용하는 문서
- 위키데이터 속성 P4143을 사용하는 문서
- 위키데이터 속성 P4186을 사용하는 문서
- 위키데이터 속성 P4423을 사용하는 문서
- 위키데이터 속성 P4457을 사용하는 문서
- 위키데이터 속성 P4534를 사용하는 문서
- 위키데이터 속성 P4535를 사용하는 문서
- 위키데이터 속성 P4581을 사용하는 문서
- 위키데이터 속성 P4613을 사용하는 문서
- 위키데이터 속성 P4955를 사용하는 문서
- 위키데이터 속성 P5034를 사용하는 문서
- 위키데이터 속성 P5226을 사용하는 문서
- 위키데이터 속성 P5288을 사용하는 문서
- 위키데이터 속성 P5302를 사용하는 문서
- 위키데이터 속성 P5321을 사용하는 문서
- 위키데이터 속성 P5368을 사용하는 문서
- 위키데이터 속성 P5504를 사용하는 문서
- 위키데이터 속성 P5587을 사용하는 문서
- 위키데이터 속성 P5736을 사용하는 문서
- 위키데이터 속성 P5818을 사용하는 문서
- 위키데이터 속성 P6213을 사용하는 문서
- 위키데이터 속성 P6734를 사용하는 문서
- 위키데이터 속성 P6792를 사용하는 문서
- 위키데이터 속성 P6804를 사용하는 문서
- 위키데이터 속성 P6829를 사용하는 문서
- 위키데이터 속성 P7293을 사용하는 문서
- 위키데이터 속성 P7303을 사용하는 문서
- 위키데이터 속성 P7314를 사용하는 문서
- 위키데이터 속성 P7902를 사용하는 문서
- 위키데이터 속성 P8034를 사용하는 문서
- 위키데이터 속성 P8189를 사용하는 문서
- 위키데이터 속성 P8381을 사용하는 문서
- 위키데이터 속성 P8671을 사용하는 문서
- 위키데이터 속성 P8980을 사용하는 문서
- 위키데이터 속성 P9070을 사용하는 문서
- 위키데이터 속성 P9692를 사용하는 문서
- 위키데이터 속성 P9725를 사용하는 문서
- 위키데이터 속성 P9984를 사용하는 문서
- 위키데이터 속성 P10020을 사용하는 문서
- 위키데이터 속성 P10299를 사용하는 문서
- 위키데이터 속성 P10608을 사용하는 문서
- 위키데이터 속성 P10832를 사용하는 문서
- 위키데이터 속성 P11249를 사용하는 문서
- 위키데이터 속성 P11646을 사용하는 문서
- 위키데이터 속성 P11729를 사용하는 문서
- 위키데이터 속성 P12204를 사용하는 문서
- 위키데이터 속성 P12362를 사용하는 문서
- 위키데이터 속성 P12754를 사용하는 문서
- 위키데이터 속성 P13049를 사용하는 문서
- 2001년 설립
- 인터넷의 역사
- 전자 도서관
- 온라인 아카이브
- 1996년 개설된 인터넷 자산