Сегодня 28 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → бекап

GIF с танцем Рейчел из «Друзей» разросся до сотен гигабайт и сломал бэкапы Discourse

Discourse — широко используемая платформа для обсуждений, которая в настоящее время поддерживает более 22 000 онлайн-сообществ. Резервное копирование сайта было нарушено из-за GIF-файла размером 1,6 Мбайт, который был скопирован пользователями 246 173 раза, что превысило лимит файловой системы Linux ext4 на жёсткие ссылки. В результате анимация танца радости Рейчел из сериала «Друзья» в исполнении Дженнифер Энистон (Jennifer Aniston) заняла в бэкапе 377 Гбайт.

 Источник изображений: warnerbros.com

Источник изображений: warnerbros.com

Платформа Discourse позволяет пользователям вставлять эмодзи и GIF-изображения в свои обсуждения. «Когда файл перемещается между контекстами безопасности (например, из личного сообщения в публикацию), система создаёт новую копию со случайным SHA1, — пояснил технический блогер Discourse Джейк Голдсборо (Jake Goldsborough). — Исходное содержимое идентично, но Discourse рассматривает его как новый файл».

Таким образом, популярное изображение или GIF-реакция распространяется по постам, репостам и личным сообщениям, и каждый контекст создаёт ещё одну копию файла. Файл, создавший 377 Гбайт избыточного размера бэкапа — это Рейчел из сериала «Друзья», танцующая свой танец радости. Эта GIF-анимация, по словам Discourse, «постоянно использовалась в постах, личных сообщениях, повсюду».

Первая попытка Discourse решить проблему перегрузки системы дубликатами заключалась в отслеживании оригинального контента по его хешу. Во время резервного копирования загрузки группировались по хешу, и загружался только первый файл в каждой группе. Для всех дубликатов создавались жёсткие ссылки.

Это казалось элегантным решением, пока компания не столкнулась с ограничением файловой системы ext4 на примерно 65 000 жёстких ссылок на один индексный дескриптор (inode). В результате, по словам Discourse, «вместо одной загрузки для всех 246 173 дубликатов мы получили одну загрузку плюс 181 000 резервных загрузок после достижения лимита».

Discourse всё же удалось найти решение. Оно начинается так же, как и старое, с создания жёстких ссылок. Но когда файловая система выдаёт сообщение об ошибке EMLINK («превышение лимита жёстких ссылок»), следующая копия файла становится «основной», пока снова не будет достигнут лимит. Эта новая мера, по словам Discourse, «работает на любой файловой системе, никакой настройки не требуется».

«Теперь мы знаем, что Дженнифер Энистон может проводить стресс-тестирование инфраструктуры», — с иронией прокомментировала ситуацию Discourse в своём блоге.


window-new
Soft
Hard
Тренды 🔥
ИИ заполоняет интернет: 35 % появившихся за последние годы сайтов были созданы нейросетями 22 мин.
Nvidia выпустила драйвер с поддержкой новой версии мобильной GeForce RTX 5070 36 мин.
Nacon закроет студию Spiders — разработчиков Greedfall и Steelrising никто не захотел купить 49 мин.
Игроки не оценили S&box — духовный наследник Garry’s Mod собирает в Steam «смешанные» отзывы 2 ч.
Режиссёр Resident Evil 2 спустя почти 30 лет раскрыл секрет происхождения имени Леона Кеннеди 3 ч.
Google «Play Маркет» начнёт помечать приложения, оптимизированные для больших экранов 3 ч.
Минцифры РФ прорабатывает введение платы за VPN-трафик 4 ч.
NEC с помощью Anthropic создаст крупнейшую в Японии команду специалистов в области ИИ, хотя сами японцы скептически относятся к ИИ 5 ч.
Решения МТС Exolve выходят за пределы России 6 ч.
Microsoft подтвердила, что уязвимость Windows позволяет красть пароли без единого клика 6 ч.
В Китае создали первую в мире топливную ячейку на угле — она даёт электричество без дыма, пара и генераторов 15 мин.
Анонсирован игровой смартфон OnePlus Ace 6 Ultra с Dimensity 9500, батареей на 8600 мА·ч и геймпадом 28 мин.
Автопилот Super Cruise от GM преодолел 1 миллиард миль — на это ушло 9 лет 30 мин.
Nvidia представила мобильную GeForce RTX 5070 с 12 Гбайт памяти 36 мин.
Gigabyte представила тонкий ноутбук Aero X16 с новой версией GeForce RTX 5070 для «задач ИИ нового поколения» 3 ч.
С миру по миллиарду: Oracle всё-таки насобирала $16 млрд на ИИ ЦОД OpenAI в Мичигане 3 ч.
SpaceX привязала гонорар Илона Маска к колонизации Марса и запуску орбитальных ЦОД 3 ч.
Представлена робот-рыба Bionic Arowana за $5000 — доступная альтернатива живой ароване для аквариума 4 ч.
Samsung Heavy Industries займётся строительством плавучих ЦОД совместно с американской Mousterian Corporation 4 ч.
Google и Meta теряют ИИ-таланты — те создают стартапы и привлекают миллиарды 5 ч.