Сегодня 12 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

На этой неделе исследователи из лаборатории Sky Computing Lab Калифорнийского университета в Беркли запустили модель искусственного интеллекта Sky-T1-32B-Preview. Речь идёт о нейросети со способностью к рассуждениям, которая способна конкурировать с OpenAI o1 по ряду ключевых показателей.

 Источник изображения: Lee Campbell/Unsplash

Источник изображения: Lee Campbell/Unsplash

По всей видимости, Sky-T1 является первой моделью с поддержкой рассуждений с открытым исходным кодом, что позволит воспроизвести её с нуля. Разработчики опубликовали набор данных, который использовался для обучения алгоритма, а также другие данные, необходимые для запуска ИИ-модели.

Одна из главных особенностей алгоритма в том, что для его обучения не требуются существенные затраты. «Примечательно, что Sky-T1-32B-Preview был обучен менее чем за $450», — написали разработчики в своём блоге. Таким образом, они наглядно продемонстрировали, что возможно создать ИИ-модель со способностью к рассуждениям высокого уровня без существенных денежных вложений.

Ещё недавно стоимость обучения большой языковой модели с сопоставимыми характеристиками измерялась миллионами долларов. Существенно снизить затраты удалось за счёт использования синтетических данных, т.е. данных, сгенерированных другими нейросетями. К примеру, недавно выпущенный компанией Winter алгоритм Palmyra X 004 обучался на синтетических данных и обошёлся разработчикам в $700 тыс.

В отличие от многих ИИ-алгоритмов, модели с возможностью рассуждения эффективно проверяют факты, что позволяет им давать более точные ответы и реже ошибаться, вводя пользователей в заблуждение. Кроме того, моделям рассуждения обычно требуется больше времени на формирование ответа на запрос по сравнению с обычными ИИ-алгоритмами. Однако обычно рассуждающие модели являются более надёжными, особенно в таких областях, как физика, математика и естественные науки.

Согласно имеющимся данным, разработчики задействовали модель рассуждения Alibaba QwQ-32B-Preview для создания первоначального набора данных для обучения Sky-T1. Далее данные преобразовывались с помощью GPT-4o-mini от OpenAI в более точный формат. Процесс обучения Sky-T1 с 32 млрд параметров занял около 19 часов, для чего были задействованы 8 графических ускорителей Nvidia H100.

«В дальнейшем мы сосредоточимся на разработке более эффективных моделей, которые сохраняют высокую производительность рассуждений, а также на изучении передовых методов повышения эффективности и точности моделей во время тестирования. Следите за обновлениями, пока мы добиваемся прогресса в реализации этих интересных инициатив», — написали разработчики в своём блоге.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Владелец TinTok выпустил ИИ-модель Seedance 2.0 для генерации видео — она стала вирусной 6 мин.
Mewgenics за полтора дня стала самой быстро продаваемой игрой от создателя The Binding of Isaac и Super Meat Boy 16 мин.
Илон Маск объяснил массовый исход основателей xAI 42 мин.
«Это шаг назад»: WhatsApp выступил против блокировки в России 2 ч.
Система визуализации «Графиня» получила модульную архитектуру и средства трансформации данных 3 ч.
Бесплатные пользователи ИИ-бота Claude получили ряд функций, прежде доступных только по подписке 4 ч.
OpenAI начала терять исследователей после появления рекламы в ChatGPT 4 ч.
Sony определилась с датой выхода экранизации Helldivers от режиссёра «Форсажа» — в фильме сыграет звезда «Игры Престолов» и «Minecraft в кино» 4 ч.
Kingdom Come: Deliverance 2 отметила годовщину с релиза «монументальным достижением» 5 ч.
OpenAI распустила команду, которая объясняла миру её миссию 6 ч.
Для самых ленивых: выпущен робот для складывания белья после стирки за $7999 5 мин.
MSI оценила GeForce RTX 5090 Lightning Z в $5090 — всего выйдет 1300 видеокарт, а право покупки разыграют в лотерее 10 мин.
Samsung первой запустила HBM4 в серию — для ускорителей Nvidia Vera Rubin 19 мин.
«МегаФон» стал уведомлять абонентов о повышении цен, но от него можно отказаться 45 мин.
Огромный промышленный робот по прозвищу «Годзилла» ускорит сборку термоядерного реактора ИТЭР 50 мин.
Anthropic пообещала, что её ИИ ЦОД не повлияют на счета за электричество обычных граждан, но есть один нюанс 2 ч.
MGX из ОАЭ готова вложить сотни миллионов долларов в Anthropic, которой потребовались ещё $20 млрд инвестиций 3 ч.
Meta анонсировала строительство очередного гигаваттного кампуса ЦОД стоимостью $10 млрд 4 ч.
Защищённый компьютер AAEON Pico-ADN4-Semi Rev.B на базе Intel Alder Lake-N ориентирован на телеком-сектор 5 ч.
Французская Mistral AI вложит €1,2 млрд в строительство шведского ИИ ЦОД 5 ч.