Сегодня 15 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Совет директоров OpenAI сможет блокировать выпуск нейросетей, если сомневается в их безопасности

После недавнего скандала с отставкой генерального директора OpenAI Сэма Альтмана (Sam Altman) и его возвращения компания OpenAI всерьёз задумалась не только о реформировании структуры управления бизнесом, но и повышении ответственности разработчиков за выпуск больших языковых моделей. Теперь совет директоров может задержать выпуск новых моделей, если сочтёт их недостаточно безопасными.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Ключевая роль в этом механизме контроля и согласования будет отведена, по данным Bloomberg, специальной «группе готовности» под руководством Александра Мадри (Aleksander Madry), совмещающего эту должность с научной деятельностью в Массачусетском технологическом институте. В задачи группы экспертов будет входить анализ подготовленной к релизу каждой новой большой языковой модели на предмет выявления «катастрофических рисков». К таковым относятся вероятные последствия применения данной языковой модели, которые повлекут сотни миллиардов долларов материального ущерба или даже человеческие жертвы.

Группа Мадри будет на ежемесячной основе делиться отчётами о деятельности разработчиков OpenAI со специальным советом по безопасности, а тот уже будет делиться своими выводами с генеральным директором компании и советом директоров. Сэм Альтман сможет принимать решение о выпуске новой языковой модели на рынок или её задержке для доработки, причём совет директоров получает право наложить вето на положительное решение главы OpenAI о выпуске модели в общий доступ.

Группа анализа готовности языковых моделей была сформирована внутри OpenAI ещё в октябре, до хорошо известных событий с перестановками в руководстве. В целом, внутри компании действуют ещё две группы, занимающиеся анализом разработок. Прежде всего, это группа безопасности как таковой, а также группа «сверхрегулирования» (superalignment), которая учитывает гипотетические угрозы от внедрения сверхмощных систем искусственного интеллекта в будущем.

Разрабатываемые OpenAI языковые модели будут оцениваться группой Мадри по шкале, подразумевающей четыре градации рисков: низкая, средняя, высокая или критическая. По замыслу, компания сможет выпускать в оборот только те системы искусственного интеллекта, которые в итоге всех процедур анализа и доработки получили оценку риска не выше низкого или среднего. Как признался сам Мадри, «OpenAI — это не что-то, происходящее само собой и способное нести нам пользу или вред, это нечто, формируемое нами». Представитель компании выразил надежду, что подобным подходом к управлению рисками в сфере искусственного интеллекта будут пользоваться и другие разработчики. В стенах OpenAI подобная практика формировалась последовательно и в течение последних двух месяцев просто была закреплена решениями высшего руководства.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
VK похвалилась, что почти удвоила число блогеров в «VK Видео» за девять месяцев 22 мин.
В файлах обновления Deadlock засветилось кодовое название неанонсированной игры Valve во вселенной Team Fortress 38 мин.
Ложная тревога: Valve опровергла взлом Steam и кражу личных данных 89 миллионов пользователей 2 ч.
Apple внедрит управление взглядом в гарнитуру Vision Pro 3 ч.
OpenAI выпустила модели GPT-4.1 для пользователей ChatGPT 4 ч.
YouTube начнёт показывать рекламу рядом с самыми интересными местами видео 5 ч.
Google запретит запуск Chrome с правами администратора ради безопасности ПК 5 ч.
Google представила ИИ-систему AlphaEvolve, которая отлично создаёт и оптимизирует алгоритмы — она ускорит обучение других ИИ 12 ч.
Stability AI выпустила ИИ-генератор музыки, который быстро работает даже на смартфоне 12 ч.
Релиз окончательного издания Mortal Kombat 1 возмутил фанатов — игру обещали поддерживать годами 13 ч.
Австралия станет космической державой — первая ракета готова к историческому запуску 39 мин.
Наушники HUAWEI FreeBuds 6, которые понимают жесты 2 ч.
СЖО с гарантией: Intel и Shell предложили сертифицированные системы погружного охлаждения для платформ на базе Xeon 2 ч.
Сети и ИИ: Cisco объявила о сотрудничестве с Humain и целым рядом других организаций стран Персидского залива 3 ч.
SpaceX предложила альтернативу GPS на основе Starlink 3 ч.
У Xiaomi рухнули продажи электромобилей — они потеряли доверие покупателей 4 ч.
Sony готова ещё раз поднять цены на игровые консоли из-за таможенных тарифов 4 ч.
Samsung первой внедрит гибридное соединение в память HBM4, пока её конкуренты осторожничают 6 ч.
Intel Foundry выйдет на безубыточность в 2027 году при помощи техпроцесса 14A 7 ч.
Продажи серверов в России падают второй год подряд — потенциал импортозамещения практически исчерпан 12 ч.