Сегодня 22 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI отказалась от энергоэффективной ИИ-модели Arrakis — её разработка зашла в необъяснимый тупик

Ответственная за нейросеть GPT-4 и службу ChatGPT компания OpenAI работала над новой моделью искусственного интеллекта Arrakis, которая предлагала более высокую эффективность и, соответственно, более низкую себестоимость обслуживания. Но проект пришлось приостановить из-за проблем с качеством.

 Источник изображения: Zac Wolff / unsplash.com

Источник изображения: Zac Wolff / unsplash.com

Предполагалось, что Arrakis будет иметь возможности, сравнимые с GPT-4, но окажется более дешёвой в развёртывании — её спроектировали с использованием так называемого принципа разрежённости. Это значит, что обработка входящих данных производится только частью нейросети, тогда как традиционные «плотные модели» задействуют все её участки. Принцип разрежённости используется, например, Google в проекте Pathways.

Разработка Arrakis началась прошлой осенью, а обучение модели начали этой весной. Но разработчики OpenAI быстро поняли, что система действует слишком медленно. В течение месяца они пытались произвести настройку модели, но затем руководство закрыло проект. Причины сбоя установить пока не удалось: принцип разрежённости хорошо работал в ранних тестах, но в более крупной модели проявить себя не сумел.

Несмотря на неудачу, OpenAI сможет использовать наработки Arrakis и мультимодальной модели Gobi в других проектах. Большие надежды на Arrakis возлагали и в Microsoft: сейчас софтверный гигант переключился на разработку менее дорогих языковых моделей, поскольку высокая себестоимость обслуживания генеративного ИИ начала угрожать её бизнесу.

Arrakis генерировала не только текст, но также изображения и видео; у неё было меньше галлюцинаций, чем у GPT-4; и она могла работать в качестве автономного агента. Модель была частично обучена на синтетических данных, а её выход планировался на 2024 год. Проект мог вылиться в целую систему создания более эффективных моделей — есть версия, что он способствовал разработке нейросети GPT-3.5 Turbo.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Gmail упростил отписку от надоедливых рассылок, собрав их все в одном месте 19 мин.
Курс биткоина превысил $90 000 впервые за шесть недель 2 ч.
UserGate обновила и расширила экосистему ИБ UserGate SUMMA и реорганизовала работу с учётом потребностей клиентов 2 ч.
Google призналась, что платит Samsung «огромные деньги» за предустановку Gemini на Galaxy 2 ч.
Windows 11 впервые установили и запустили на Apple iPad Air 2 ч.
Журналисты и блогеры готовятся разразиться подробностями и геймплеем Death Stranding 2: On the Beach — Кодзима пригласил в гости 3 ч.
«VK Видео» запустит платную подписку для отключения рекламы в видео 4 ч.
Разработчики ИИ-приложений предпочитают технологии OpenAI, но всё быстро меняется 5 ч.
«Нанософт»: уровень пиратства на рынке инженерного ПО в России вырос до 70 % 5 ч.
Закулисное обновление разожгло слухи о скором анонсе ремейка культовой ролевой игры Persona 4 6 ч.
Астрономы обнаружили хвостатую планету, которая буквально испаряется с каждым оборотом вокруг своей звезды 2 ч.
Первый в мире монитор с E Ink и частотой обновления 60 Гц вышел на глобальный рынок за $349 2 ч.
Insta360 представила экшн-камеру X5 за $550 c простой заменой разбитых линз 2 ч.
Intel придумала разгон без потери гарантии: функция Core 200S Boost безопасно ускорит ПК на Arrow Lake, но не все 2 ч.
Казахстанский дата-центр Freedom Cloud свяжет Китай и Европу 3 ч.
«Роскосмос» рассказал, когда начнёт строить дополнительный сегмент ГЛОНАСС из 240 спутников 3 ч.
Названа самая популярная марка ноутбуков в России в этом году 4 ч.
Трёхстворчатый складной смартфон Samsung и недорогой Galaxy Z Flip FE выйдут в четвёртом квартале 4 ч.
Toshiba выпустила 24-Тбайт жёсткие диски N300 и N300 Pro на технологии CMR для работы 24/7 4 ч.
Новые игровые тесты показали пропасть в производительности между разными версиями GeForce RTX 5060 Ti 4 ч.