Сегодня 06 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

На этой неделе исследователи из лаборатории Sky Computing Lab Калифорнийского университета в Беркли запустили модель искусственного интеллекта Sky-T1-32B-Preview. Речь идёт о нейросети со способностью к рассуждениям, которая способна конкурировать с OpenAI o1 по ряду ключевых показателей.

 Источник изображения: Lee Campbell/Unsplash

Источник изображения: Lee Campbell/Unsplash

По всей видимости, Sky-T1 является первой моделью с поддержкой рассуждений с открытым исходным кодом, что позволит воспроизвести её с нуля. Разработчики опубликовали набор данных, который использовался для обучения алгоритма, а также другие данные, необходимые для запуска ИИ-модели.

Одна из главных особенностей алгоритма в том, что для его обучения не требуются существенные затраты. «Примечательно, что Sky-T1-32B-Preview был обучен менее чем за $450», — написали разработчики в своём блоге. Таким образом, они наглядно продемонстрировали, что возможно создать ИИ-модель со способностью к рассуждениям высокого уровня без существенных денежных вложений.

Ещё недавно стоимость обучения большой языковой модели с сопоставимыми характеристиками измерялась миллионами долларов. Существенно снизить затраты удалось за счёт использования синтетических данных, т.е. данных, сгенерированных другими нейросетями. К примеру, недавно выпущенный компанией Winter алгоритм Palmyra X 004 обучался на синтетических данных и обошёлся разработчикам в $700 тыс.

В отличие от многих ИИ-алгоритмов, модели с возможностью рассуждения эффективно проверяют факты, что позволяет им давать более точные ответы и реже ошибаться, вводя пользователей в заблуждение. Кроме того, моделям рассуждения обычно требуется больше времени на формирование ответа на запрос по сравнению с обычными ИИ-алгоритмами. Однако обычно рассуждающие модели являются более надёжными, особенно в таких областях, как физика, математика и естественные науки.

Согласно имеющимся данным, разработчики задействовали модель рассуждения Alibaba QwQ-32B-Preview для создания первоначального набора данных для обучения Sky-T1. Далее данные преобразовывались с помощью GPT-4o-mini от OpenAI в более точный формат. Процесс обучения Sky-T1 с 32 млрд параметров занял около 19 часов, для чего были задействованы 8 графических ускорителей Nvidia H100.

«В дальнейшем мы сосредоточимся на разработке более эффективных моделей, которые сохраняют высокую производительность рассуждений, а также на изучении передовых методов повышения эффективности и точности моделей во время тестирования. Следите за обновлениями, пока мы добиваемся прогресса в реализации этих интересных инициатив», — написали разработчики в своём блоге.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Warner Bros. подала в суд на Midjourney: сервис слишком хорошо генерирует Бэтменов и Суперменов 16 мин.
Anthropic согласилась выплатить $1,5 млрд по иску об авторских правах 4 ч.
OpenAI в ближайшие несколько лет потратит на свою инфраструктуру $115 млрд 4 ч.
Новая статья: Shinobi: Art of Vengeance — молчаливый и опасный. Рецензия 12 ч.
«Нам есть что рассказать»: глава MachineGames подтвердил планы на Wolfenstein 3 14 ч.
Microsoft Copilot научился создавать сводки по файлам и документам из облака OneDrive 16 ч.
«Красиво, страшно, залипательно»: хоррор Cronos: The New Dawn от авторов ремейка Silent Hill 2 стартовал в Steam с «очень положительными» обзорами 16 ч.
VI Форум «Мой бизнес» в Архангельске: малый бизнес, цифровизация и новые правила 18 ч.
После выхода Hollow Knight: Silksong самой желанной игрой пользователей Steam стала скандальная Subnautica 2 18 ч.
Apple обвинили в нарушении патентов на технологию «Привет, Siri» 19 ч.
Частоту сердечного ритма измерили Wi-Fi-сигналом 13 мин.
Очередной запуск спутников SpaceX Starlink ознаменовался 500-й посадкой первой ступени ракеты Falcon 9 28 мин.
Motorola представила смартофн Edge 60 Neo с батареей на 5000 мА·ч и защитой IP69 4 ч.
Специалисты iFixit оценили Google Pixel 10 средним баллом за ремонтопригодность 4 ч.
Google тайком удалила обещание стать углеродно-нейтральной к 2030 году — всему виной аппетиты ИИ 11 ч.
Европа оштрафовала Google почти на €3 млрд за злоупотребления на рекламном рынке 11 ч.
Karri Messenger позволит детям безопасно общаться с родителями и друзьями при помощи голосовых сообщений 16 ч.
Qualcomm и BMW представили систему автономного вождения, которую будут продавать на сторону 16 ч.
Huawei заняла почти половину мирового рынка складных смартфонов — Samsung даже не вторая по популярности 17 ч.
На IFA 2025 показали пауэрбанк, который работает даже с пробитой батареей 18 ч.