Сегодня 07 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Ключевой специалист OpenAI по безопасности ИИ перешла работать к конкуренту

Ведущий специалист по исследованиям в области безопасности искусственного интеллекта Андреа Валлоне (Andrea Vallone) покинула OpenAI и присоединилась к команде конкурента, компании Anthropic. В OpenAI Валлоне три года руководила исследованиями, посвящёнными критически важному и пока слабо регулируемому вопросу относительно того, как ИИ-модели должны реагировать, когда в диалоге с ними пользователь проявляет признаки чрезмерной эмоциональной зависимости или ранние признаки психического расстройства.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Как стало известно The Verge, Валлоне перейдёт в команду Anthropic Alignment. Её переход произошёл в период усиления внимания к этическим и социальным рискам, связанным с генеративным ИИ. Так, за последний год несколько ведущих стартапов столкнулись с серьёзной критикой и судебными исками после трагических инцидентов, когда пользователи, испытывавшие психические трудности, ещё сильнее усугубляли свой кризис в беседах с чат-ботами. Например, широко обсуждались случаи, когда после взаимодействия с ИИ подростки совершали суицид, а взрослые люди — убийства. Этот вопрос уже обсуждался на слушаниях в подкомитете Сената США, а семьи пострадавших подали судебные иски.

За три года работы на предыдущем месте она сформировала группу по изучению политики поведения ИИ и участвовала в развёртывании GPT-4, рассуждающих моделей (reasoning models) и GPT-5, а также разрабатывала процессы обучения для ключевых технических методов безопасности. В Anthropic Валлоне будет работать под руководством Яна Лайке (Jan Leike), который покинул OpenAI в мае 2024 года, заявив, что в компании «процессы безопасности уступили место эффектным продуктам».

В своём сообщении в LinkedIn Валлоне написала, что она «с нетерпением ждёт продолжения своих исследований в Anthropic, сосредоточившись на тонкой настройке поведения Claude в новых контекстах». Одновременно Сэм Боуман (Sam Bowman), один из руководителей команды Anthropic Alignment, написал в своём посте в LinkedIn, что он «гордится тем, насколько серьёзно Anthropic относится к проблеме определения того, как должна вести себя система искусственного интеллекта».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Календарь релизов 6 – 12 апреля: Starfield: Terran Armada, DarkSwitch и People of Note 11 ч.
На момент анонса State of Decay 3 существовала лишь в виде документа Word — никаких зомби-животных в игре не будет 13 ч.
Китайские власти не смогли заблокировать мессенджер Bitchat, поэтому заставили Apple его удалить 16 ч.
В РКН пожаловались на резкий скачок DDoS-атак на государственные информресурсы в феврале–марте 17 ч.
«Это только начало»: авторы Arc Raiders сделали крафтинг удобнее и пообещали впредь реагировать на жалобы игроков 17 ч.
Список достижений Starfield раскрыл неанонсированные секреты дополнения Terran Armada 19 ч.
В Google Play появилась функция поиска по отзывам 20 ч.
Британцы пытаются «заманить» к себе Anthropic после конфликта с Пентагоном 20 ч.
Свежий трейлер аркадного авиасимулятора Ace Combat 8: Wings of Theve показал, какой путь серия проделала за 30 лет 20 ч.
Глава разработки Skyblivion объяснил, зачем команде срочно понадобились новые специалисты, хотя ремейк уже на финишной прямой 20 ч.
OpenAI потребовала от генеральных прокуроров Калифорнии и Делавэра заняться расследованием «неконкурентного поведения» Илона Маска 15 мин.
Разработка складного Apple iPhone упёрлась в технические проблемы, осенний дебют под угрозой задержки 2 ч.
Samsung в первом квартале нарастила операционную прибыль в 8,5 раз до рекордных $37,9 млрд 2 ч.
Многолетняя тяжба Apple и Epic Games дойдёт до Верховного суда США во второй раз 4 ч.
Broadcom расширила контракт по снабжению Google ИИ-чипами, Anthropic тоже почувствует выгоду 5 ч.
Новая статья: ИИтоги марта 2026 г.: мартышкин труд? 9 ч.
Intel внезапно представила пару мобильных процессоров серий Arrow Lake-HX и Panther Lake 13 ч.
Умные очки Meta научились изучать еду пользователя и рассказывать о её питательной ценности 14 ч.
Дефицит Mac Mini и Mac Studio усугубляется: сроки поставки растянулись вплоть до сентября 15 ч.
Intel пообещала и дальше выпускать устаревающие процессоры Raptor Lake, чтобы помочь пережить дефицит DDR5 15 ч.