Сегодня 16 января 2026
18+
MWC 2018 2018 Computex IFA 2018
3DNews Технологии и рынок IT. Новости Искусственный интеллект, машинное обучен... Ключевой специалист OpenAI по безопаснос...
реклама
Новости Hardware

Ключевой специалист OpenAI по безопасности ИИ перешла работать к конкуренту

Ведущий специалист по исследованиям в области безопасности искусственного интеллекта Андреа Валлоне (Andrea Vallone) покинула OpenAI и присоединилась к команде конкурента, компании Anthropic. В OpenAI Валлоне три года руководила исследованиями, посвящёнными критически важному и пока слабо регулируемому вопросу относительно того, как ИИ-модели должны реагировать, когда в диалоге с ними пользователь проявляет признаки чрезмерной эмоциональной зависимости или ранние признаки психического расстройства.

Источник изображения: Anthropic

Источник изображения: Anthropic

Как стало известно The Verge, Валлоне перейдёт в команду Anthropic Alignment. Её переход произошёл в период усиления внимания к этическим и социальным рискам, связанным с генеративным ИИ. Так, за последний год несколько ведущих стартапов столкнулись с серьёзной критикой и судебными исками после трагических инцидентов, когда пользователи, испытывавшие психические трудности, ещё сильнее усугубляли свой кризис в беседах с чат-ботами. Например, широко обсуждались случаи, когда после взаимодействия с ИИ подростки совершали суицид, а взрослые люди — убийства. Этот вопрос уже обсуждался на слушаниях в подкомитете Сената США, а семьи пострадавших подали судебные иски.

За три года работы на предыдущем месте она сформировала группу по изучению политики поведения ИИ и участвовала в развёртывании GPT-4, рассуждающих моделей (reasoning models) и GPT-5, а также разрабатывала процессы обучения для ключевых технических методов безопасности. В Anthropic Валлоне будет работать под руководством Яна Лайке (Jan Leike), который покинул OpenAI в мае 2024 года, заявив, что в компании «процессы безопасности уступили место эффектным продуктам».

В своём сообщении в LinkedIn Валлоне написала, что она «с нетерпением ждёт продолжения своих исследований в Anthropic, сосредоточившись на тонкой настройке поведения Claude в новых контекстах». Одновременно Сэм Боуман (Sam Bowman), один из руководителей команды Anthropic Alignment, написал в своём посте в LinkedIn, что он «гордится тем, насколько серьёзно Anthropic относится к проблеме определения того, как должна вести себя система искусственного интеллекта».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Apple заплатит Google миллиарды долларов за Gemini — OpenAI отказалась от сделки по Siri
ИИ-модели начали щёлкать сложные математические задачи
Трое выходцев из OpenAI вернулись в компанию, покинув ИИ-стартап Миры Мурати
TSMC может начать выпуск 3-нм ИИ-чипов OpenAI Titan уже в этом году — второе поколение перейдёт на 1,6 нм
Китайские власти ещё не разрешили местным разработчикам закупку Nvidia H200, но уже интересуются, потребуется ли им Blackwell
OpenAI договорилась о покупке царь-ускорителей Cerebras на $10 млрд — чтобы снизить зависимость от Nvidia
Теги: openai, anthropic, ии, кадры, безопасность
openai, anthropic, ии, кадры, безопасность
← В прошлое

© 1997—2026 Электронное периодическое издание "3ДНьюс" | Свидетельство о регистрации СМИ Эл ФС 77-22224

выдано Федеральной Службой по надзору за соблюдением законодательства в сфере массовых коммуникаций и охране культурного наследия

При цитировании документа ссылка на сайт с указанием автора обязательна. Полное заимствование документа является нарушением
российского и международного законодательства и возможно только с согласия редакции 3DNews.

Яндекс.Метрика

window-new
Контакты Поиск Реклама О сайте
Soft
Hard
Тренды 🔥
Власти Индии обязали производителей смартфонов, включая Apple и Samsung, предустанавливать неудаляемое государственное приложение
Стример первым в мире прошёл Escape from Tarkov — он сбежал из Таркова, но какой ценой?
Чудеса оптимизации: разработчики Helldivers 2 сократили размер игры на ПК со 154 до 23 Гбайт почти без вреда для скорости загрузок
В OpenAI введён «красный код»: Альтман требует бросить все силы на срочное улучшение ChatGPT
На Солнце вызревает аномальная активность — она может закончиться «чёрным лебедем»
10 тысяч модов и 350 миллионов загрузок: Larian похвасталась новыми достижениями игроков Baldur’s Gate 3 6 ч.
Вызывающий привыкание роглайк Ball x Pit достиг миллиона проданных копий и в 2026 году получит новые шары 7 ч.
Соавтор Counter-Strike признался в любви к русской культуре и рассказал о «самом депрессивном» периоде за 25 лет карьеры 9 ч.
Apple резко снизила награды багхантерам — при этом рост вредоносов в macOS бьёт рекорды 9 ч.
Mortal Kombat 1, Routine и Dome Keeper возглавили первую волну декабрьских новинок Game Pass, а Mortal Kombat 11 скоро подписку покинет 10 ч.
Google закрыла 107 дыр в Android — две нулевого дня уже использовались в атаках 10 ч.
В YouTube появился Recap — пользователям расскажут, чем они занимались на платформе в течение года 10 ч.
ИИ-агенты научились взламывать смарт-контракты в блокчейне — это риск на сотни миллионов долларов 10 ч.
Инструмент YouTube для защиты блогеров от дипфейков создал риск утечки их биометрии 11 ч.
В Microsoft Teams появились «иммерсивные встречи» в метавселенной с аватарами без ног 11 ч.
Новая статья: Обзор смартфона realme GT 8 Pro: модульный флагман с очень крутой камерой 4 ч.
AWS «сдалась на милость» NVIDIA: анонсированы ИИ-ускорители Trainium4 с шиной NVLink Fusion 4 ч.
Новая статья: Обзор телевизора HARPER 55Q970TS: QD Mini LED — в массы! 5 ч.
iPhone 18 придётся ждать дольше обычного — аналитики предрекают крупнейшее падение поставок Apple за годы 5 ч.
Экс-глава Intel выбил $150 млн от США на разработку прорывного EUV-источника — конкурента системам ASML 7 ч.
Samsung и SK hynix решили сделать всё, чтобы дефицит DRAM не прекращался 8 ч.
Слепому человеку впервые вернули зрение с помощью напечатанной на 3D-принтера роговицей 10 ч.
ИИ сломал Big Tech: золотое правило «трать мало, зарабатывай много» больше не работает 11 ч.
Тайвань обвинил Tokyo Electron в допущении кражи секретных технологий TSMC 11 ч.
Российская ИИ-система Delta Sprut XL поддерживает до 25 GPU 11 ч.