Использовать компьютеры серии Apple Mac в качестве сервера — идея оригинальная, ведь, несмотря на свои корни в Unix, операционная система macOS не предназначается для корректной работы без присмотра, и настроить и использовать её в этом режиме будет непросто. Тем более, что она оказалась неспособной корректно обрабатывать сетевую активность дольше 49 дней, 17 часов, 2 минут и 47 секунд.

Ошибку в работе Apple macOS обнаружили инженеры компании Photon, у которых работает парк компьютеров Mac, используемых для мониторинга сервисов iMessage. В какой-то момент эти компьютеры перестают отвечать на сетевые подключения, хотя корректно обрабатывают пинг. Любопытно, что при этом они продолжают поддерживать существующие сетевые соединения, и это ещё больше затрудняет диагностику. По традиции, проблема решается перезагрузкой, но установить её причину это не помогает.
Специалисты Photon обратили внимание, что проблема проявляется при 49,7 сутках непрерывной работы компьютеров Apple в сети, и создали несколько скриптов, чтобы проверить свою теорию. Как выяснилось, виновником сбоя является системный счётчик «tcp_now», задача которого — отслеживать текущее время в миллисекундах с момента загрузки для стека TCP. Значения «tcp_now» представляются в формате 32-битного натурального числа, максимальное значение которого составляет 4 294 967 295 (2³² - 1), после чего оно обнуляется. В миллисекундах это как раз 49,7 суток.
Согласно стандартам, операционные системы быстро удаляют открытые TCP-соединения; для macOS этот период составляет 30 секунд. Когда значение «tcp_now» оказывается близким к пределу или достигает его, статус истечения срока действия соединения вычисляется относительно этого показателя, в результате чего получается значение, которое превышает 32-битное натуральное число. Когда происходит периодическая проверка, чтобы определить, следует ли удалить закрытое соединение, система из-за математической ошибки даёт отрицательный ответ. Стек TCP переполняется по ошибке удерживаемыми временными портами и перестаёт работать, когда доступных портов уже не остаётся. Быстрота этого процесса зависит от объёма сетевой активности, но в любой серверной или профессиональной среде это происходит быстро.
Поэтому перезагрузка действительно решает проблему. Эта проблема является источником нескольких известных ошибок, на которые жалуется сообщество владельцев компьютеров Apple. Возможно, вскоре появятся более цивилизованные способы её решения.
Источник:


MWC 2018
2018
Computex
IFA 2018






