Сегодня 09 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Ключевой специалист OpenAI по безопасности ИИ перешла работать к конкуренту

Ведущий специалист по исследованиям в области безопасности искусственного интеллекта Андреа Валлоне (Andrea Vallone) покинула OpenAI и присоединилась к команде конкурента, компании Anthropic. В OpenAI Валлоне три года руководила исследованиями, посвящёнными критически важному и пока слабо регулируемому вопросу относительно того, как ИИ-модели должны реагировать, когда в диалоге с ними пользователь проявляет признаки чрезмерной эмоциональной зависимости или ранние признаки психического расстройства.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Как стало известно The Verge, Валлоне перейдёт в команду Anthropic Alignment. Её переход произошёл в период усиления внимания к этическим и социальным рискам, связанным с генеративным ИИ. Так, за последний год несколько ведущих стартапов столкнулись с серьёзной критикой и судебными исками после трагических инцидентов, когда пользователи, испытывавшие психические трудности, ещё сильнее усугубляли свой кризис в беседах с чат-ботами. Например, широко обсуждались случаи, когда после взаимодействия с ИИ подростки совершали суицид, а взрослые люди — убийства. Этот вопрос уже обсуждался на слушаниях в подкомитете Сената США, а семьи пострадавших подали судебные иски.

За три года работы на предыдущем месте она сформировала группу по изучению политики поведения ИИ и участвовала в развёртывании GPT-4, рассуждающих моделей (reasoning models) и GPT-5, а также разрабатывала процессы обучения для ключевых технических методов безопасности. В Anthropic Валлоне будет работать под руководством Яна Лайке (Jan Leike), который покинул OpenAI в мае 2024 года, заявив, что в компании «процессы безопасности уступили место эффектным продуктам».

В своём сообщении в LinkedIn Валлоне написала, что она «с нетерпением ждёт продолжения своих исследований в Anthropic, сосредоточившись на тонкой настройке поведения Claude в новых контекстах». Одновременно Сэм Боуман (Sam Bowman), один из руководителей команды Anthropic Alignment, написал в своём посте в LinkedIn, что он «гордится тем, насколько серьёзно Anthropic относится к проблеме определения того, как должна вести себя система искусственного интеллекта».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В ЕС назвали VPN лазейкой для обмана систем проверки возраста — и её хотят закрыть 4 мин.
Департамент DOGE Илона Маска использовал ChatGPT глупым и незаконным способом 8 мин.
С опозданием на месяц OpenAI ответила на Claude Mythos — вышла модель GPT-5.5-Cyber, которая не боится обсуждать кибератаки и эксплойты 2 ч.
Новая статья: Saros — исправление ошибок, которых не было. Рецензия 12 ч.
«Мощный инструмент, но не замена художников и творцов»: руководство Sony прояснило использование генеративного ИИ в играх PlayStation 14 ч.
Роскомнадзор заявил, что не ограничивал доступ к GitHub 17 ч.
Шпионский боевик 007 First Light от создателей Hitman получил системные требования для игры в 4K, а трассировку пути придётся подождать 17 ч.
ИИ теперь пишет 60 % нового кода Airbnb — и сам решает 40 % запросов в техподдержку 19 ч.
Google начала тестировать ИИ-агента Remy — конкурента OpenClaw 19 ч.
Россияне массово жалуются на блокировки аккаунтов в Anthropic Claude — потеряны проекты и переписки с ИИ 19 ч.
В Китае создан первый в мире «двухъядерный» квантовый компьютер — его удобно масштабировать 18 мин.
NASA испытало лопасти будущего марсианского вертолёта сверхзвуковой скоростью вращения 3 ч.
TSMC отправит устаревшее оборудование для выпуска 28-нм чипов с Тайваня в Германию 5 ч.
AMD впервые обогнала Intel по серверной выручке — бум ИИ-агентов взвинтил спрос на CPU 5 ч.
Грузовики Tesla Semi получили батареи меньшей ёмкости, чем планировалось, но на запасе хода это не сказалось 6 ч.
Акции Intel подскочили в цене на 14 % после появления информации о сделке с Apple 7 ч.
Intel снова будет производить чипы для Apple, но не как раньше — WSJ узнала о предварительном соглашении 13 ч.
Logitech нарастит инвестиции в игровые продукты, ИИ и корпоративный сегмент 15 ч.
Пентагон рассекретил первую партию файлов об НЛО — впечатлить скептиков не удалось 17 ч.
У заднеприводных Cybertruck могут отвалиться колёса — Tesla отзывает все 173 проданных электромобиля 18 ч.