В 1996 году начал работу Internet Archive, аккумулирующий на своих серверах содержание сайтов за различное время. Например, в Wayback Machine самые старые снимки сайта 3dnews.ru датированы 17 января 1999 года. Архив ставит своей задачей предоставление будущим поколениям доступ к старым материалам динамически изменяющейся Сети. Благодаря этому сохраняется доступ и к давно закрытым интернет-ресурсам.

Правда, далеко не всё информационное наполнение сайтов попадает в архив — в основном сохранению подлежит текст и изображения, размер которых не превышает отведённого лимита. Сейчас сохранено свыше 150 млрд веб-страниц, а объём накопленных данных уже достиг 10 миллионов гигабайт. Правда, на серверах сохранено и более миллиона видеозаписей (довольно скромно по сравнению с YouTube и подобными службами), а также 1,5 млн аудиофайлов, и огромное количество оцифрованных печатных изданий.
Хотя 10 Пбайт не так много по сравнению с объёмами данных, которыми оперируют интернет-гиганты вроде Facebook* (которая одна хранит свыше 100 Пбайт фотографий и видео), всё же это значительный рубеж для архива, существующего при достаточно скромном финансировании. Недавно Internet Archive сообщил о внедрении BitTorrent-загрузок для удобства пользователей и снижения нагрузки на свой канал.
Материалы по теме:
Источник:
* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».