Новости Software

Архив Интернета занимает уже больше 10 петабайт

В 1996 году начал работу Internet Archive, аккумулирующий на своих серверах содержание сайтов за различное время. Например, в Wayback Machine самые старые снимки сайта 3dnews.ru датированы 17 января 1999 года. Архив ставит своей задачей предоставление будущим поколениям доступ к старым материалам динамически изменяющейся Сети. Благодаря этому сохраняется доступ и к давно закрытым интернет-ресурсам.

Правда, далеко не всё информационное наполнение сайтов попадает в архив — в основном сохранению подлежит текст и изображения, размер которых не превышает отведённого лимита. Сейчас сохранено свыше 150 млрд веб-страниц, а объём накопленных данных уже достиг 10 миллионов гигабайт. Правда, на серверах сохранено и более миллиона видеозаписей (довольно скромно по сравнению с YouTube и подобными службами), а также 1,5 млн аудиофайлов, и огромное количество оцифрованных печатных изданий.

Хотя 10 Пбайт не так много по сравнению с объёмами данных, которыми оперируют интернет-гиганты вроде Facebook (которая одна хранит свыше 100 Пбайт фотографий и видео), всё же это значительный рубеж для архива, существующего при достаточно скромном финансировании. Недавно Internet Archive сообщил о внедрении BitTorrent-загрузок для удобства пользователей и снижения нагрузки на свой канал.

Материалы по теме:

Источник:

window-new
Soft
Hard
Тренды 🔥