Сегодня 22 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI отказалась от энергоэффективной ИИ-модели Arrakis — её разработка зашла в необъяснимый тупик

Ответственная за нейросеть GPT-4 и службу ChatGPT компания OpenAI работала над новой моделью искусственного интеллекта Arrakis, которая предлагала более высокую эффективность и, соответственно, более низкую себестоимость обслуживания. Но проект пришлось приостановить из-за проблем с качеством.

 Источник изображения: Zac Wolff / unsplash.com

Источник изображения: Zac Wolff / unsplash.com

Предполагалось, что Arrakis будет иметь возможности, сравнимые с GPT-4, но окажется более дешёвой в развёртывании — её спроектировали с использованием так называемого принципа разрежённости. Это значит, что обработка входящих данных производится только частью нейросети, тогда как традиционные «плотные модели» задействуют все её участки. Принцип разрежённости используется, например, Google в проекте Pathways.

Разработка Arrakis началась прошлой осенью, а обучение модели начали этой весной. Но разработчики OpenAI быстро поняли, что система действует слишком медленно. В течение месяца они пытались произвести настройку модели, но затем руководство закрыло проект. Причины сбоя установить пока не удалось: принцип разрежённости хорошо работал в ранних тестах, но в более крупной модели проявить себя не сумел.

Несмотря на неудачу, OpenAI сможет использовать наработки Arrakis и мультимодальной модели Gobi в других проектах. Большие надежды на Arrakis возлагали и в Microsoft: сейчас софтверный гигант переключился на разработку менее дорогих языковых моделей, поскольку высокая себестоимость обслуживания генеративного ИИ начала угрожать её бизнесу.

Arrakis генерировала не только текст, но также изображения и видео; у неё было меньше галлюцинаций, чем у GPT-4; и она могла работать в качестве автономного агента. Модель была частично обучена на синтетических данных, а её выход планировался на 2024 год. Проект мог вылиться в целую систему создания более эффективных моделей — есть версия, что он способствовал разработке нейросети GPT-3.5 Turbo.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хардкорный режим, скачки и три сюжетных дополнения: Warhorse рассказала, как будет поддерживать Kingdom Come: Deliverance 2 после релиза 5 ч.
HPE проводит расследование в связи с заявлением хакеров о взломе её систем 5 ч.
«Мы создали CRPG нашей мечты»: продажи Warhammer 40,000: Rogue Trader превысили миллион копий 6 ч.
Создатели Lineage и Guild Wars отменили MMORPG во вселенной Horizon Zero Dawn и Horizon Forbidden West 6 ч.
Instagram начал переманивать блогеров из TikTok денежными бонусами до $50 тысяч в месяц 7 ч.
Eternal Strands, Starbound, Far Cry New Dawn и ещё шесть игр: Microsoft рассказала о ближайших новинках Game Pass 8 ч.
ИИ превзойдёт человеческий разум в течение двух-трёх лет, уверен глава Anthropic 9 ч.
Keep Driving вышла на финишную прямую — новый трейлер и дата релиза ностальгической RPG о путешествии по стране на своей первой машине 9 ч.
Google стала на шаг ближе к ИИ, который думает как человек — представлена архитектура Titans 11 ч.
У «Ростелекома» произошла утечка данных — клиентам рекомендовано сменить пароли 11 ч.
GeForce RTX 5000 Kingpin не будет — легендарный оверклокер рассказал о планах на будущее, в которых есть место не только Nvidia 3 ч.
Слухи: OpenAI, Oracle и Softbank вложат $100 млрд в ИИ-инфраструктуру США, а в перспективе — до $500 млрд 3 ч.
Новая статья: Обзор смартфона OPPO Find X8: очень удобный флагман 3 ч.
К мемкоинам приведут настоящих инвесторов — поданы заявки на крипто-ETF в Dogecoin и TRUMP 4 ч.
Европа установила рекорд по отрицательным и нулевым ценам на электричество в 2024 году 4 ч.
Fujifilm представила гибридную камеру мгновенной печати Instax Wide Evo с широкоугольным объективом 8 ч.
Новый Apple iPhone SE получит вырез Dynamic Island вместо чёлки 10 ч.
К 2035 году США смогут получать до 84 ГВт из источников возобновляемой энергии на федеральных землях 10 ч.
Maxsun выпустила новые видеокарты на чипах Nvidia Kepler десятилетней давности 10 ч.
«Транснефть» направила повторный иск к Cisco на 56 млн рублей 10 ч.