Сегодня 24 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

GIF с танцем Рейчел из «Друзей» разросся до сотен гигабайт и сломал бэкапы Discourse

Discourse — широко используемая платформа для обсуждений, которая в настоящее время поддерживает более 22 000 онлайн-сообществ. Резервное копирование сайта было нарушено из-за GIF-файла размером 1,6 Мбайт, который был скопирован пользователями 246 173 раза, что превысило лимит файловой системы Linux ext4 на жёсткие ссылки. В результате анимация танца радости Рейчел из сериала «Друзья» в исполнении Дженнифер Энистон (Jennifer Aniston) заняла в бэкапе 377 Гбайт.

 Источник изображений: warnerbros.com

Источник изображений: warnerbros.com

Платформа Discourse позволяет пользователям вставлять эмодзи и GIF-изображения в свои обсуждения. «Когда файл перемещается между контекстами безопасности (например, из личного сообщения в публикацию), система создаёт новую копию со случайным SHA1, — пояснил технический блогер Discourse Джейк Голдсборо (Jake Goldsborough). — Исходное содержимое идентично, но Discourse рассматривает его как новый файл».

Таким образом, популярное изображение или GIF-реакция распространяется по постам, репостам и личным сообщениям, и каждый контекст создаёт ещё одну копию файла. Файл, создавший 377 Гбайт избыточного размера бэкапа — это Рейчел из сериала «Друзья», танцующая свой танец радости. Эта GIF-анимация, по словам Discourse, «постоянно использовалась в постах, личных сообщениях, повсюду».

Первая попытка Discourse решить проблему перегрузки системы дубликатами заключалась в отслеживании оригинального контента по его хешу. Во время резервного копирования загрузки группировались по хешу, и загружался только первый файл в каждой группе. Для всех дубликатов создавались жёсткие ссылки.

Это казалось элегантным решением, пока компания не столкнулась с ограничением файловой системы ext4 на примерно 65 000 жёстких ссылок на один индексный дескриптор (inode). В результате, по словам Discourse, «вместо одной загрузки для всех 246 173 дубликатов мы получили одну загрузку плюс 181 000 резервных загрузок после достижения лимита».

Discourse всё же удалось найти решение. Оно начинается так же, как и старое, с создания жёстких ссылок. Но когда файловая система выдаёт сообщение об ошибке EMLINK («превышение лимита жёстких ссылок»), следующая копия файла становится «основной», пока снова не будет достигнут лимит. Эта новая мера, по словам Discourse, «работает на любой файловой системе, никакой настройки не требуется».

«Теперь мы знаем, что Дженнифер Энистон может проводить стресс-тестирование инфраструктуры», — с иронией прокомментировала ситуацию Discourse в своём блоге.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Zero Parades: For Dead Spies — шпион, выйди вон. Рецензия 3 ч.
ИИ-супермодель Claude Mythos всего за месяц обнаружила свыше 10 тыс. уязвимостей в ПО 7 ч.
WhatsApp покажет отдельным списком, кто из контактов онлайн 10 ч.
В Linux обнаружена очередная серьёзная уязвимость — и ей уже десять лет 10 ч.
Firefox перестал вылетать на ПК с процессорами Intel Raptor Lake — на исправление ошибки ушёл год 10 ч.
Outlook Classic перестал показывать картинки, но Microsoft обещала всё починить 10 ч.
На GitHub напал Megalodon — вредоносный код заразил более чем 5500 репозиториев 14 ч.
Марк Цукерберг высказался в защиту тотальной слежки за действиями сотрудников Meta — для обучения ИИ, но это не точно 15 ч.
Техногиганты в последний момент отговорили Трампа подписывать указ об обязательных проверках ИИ 15 ч.
Новый поиск Google оказался капризным: из-за ИИ запросы «стой» и «игнорируй» ломают выдачу 17 ч.