Сегодня 22 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

На этой неделе исследователи из лаборатории Sky Computing Lab Калифорнийского университета в Беркли запустили модель искусственного интеллекта Sky-T1-32B-Preview. Речь идёт о нейросети со способностью к рассуждениям, которая способна конкурировать с OpenAI o1 по ряду ключевых показателей.

 Источник изображения: Lee Campbell/Unsplash

Источник изображения: Lee Campbell/Unsplash

По всей видимости, Sky-T1 является первой моделью с поддержкой рассуждений с открытым исходным кодом, что позволит воспроизвести её с нуля. Разработчики опубликовали набор данных, который использовался для обучения алгоритма, а также другие данные, необходимые для запуска ИИ-модели.

Одна из главных особенностей алгоритма в том, что для его обучения не требуются существенные затраты. «Примечательно, что Sky-T1-32B-Preview был обучен менее чем за $450», — написали разработчики в своём блоге. Таким образом, они наглядно продемонстрировали, что возможно создать ИИ-модель со способностью к рассуждениям высокого уровня без существенных денежных вложений.

Ещё недавно стоимость обучения большой языковой модели с сопоставимыми характеристиками измерялась миллионами долларов. Существенно снизить затраты удалось за счёт использования синтетических данных, т.е. данных, сгенерированных другими нейросетями. К примеру, недавно выпущенный компанией Winter алгоритм Palmyra X 004 обучался на синтетических данных и обошёлся разработчикам в $700 тыс.

В отличие от многих ИИ-алгоритмов, модели с возможностью рассуждения эффективно проверяют факты, что позволяет им давать более точные ответы и реже ошибаться, вводя пользователей в заблуждение. Кроме того, моделям рассуждения обычно требуется больше времени на формирование ответа на запрос по сравнению с обычными ИИ-алгоритмами. Однако обычно рассуждающие модели являются более надёжными, особенно в таких областях, как физика, математика и естественные науки.

Согласно имеющимся данным, разработчики задействовали модель рассуждения Alibaba QwQ-32B-Preview для создания первоначального набора данных для обучения Sky-T1. Далее данные преобразовывались с помощью GPT-4o-mini от OpenAI в более точный формат. Процесс обучения Sky-T1 с 32 млрд параметров занял около 19 часов, для чего были задействованы 8 графических ускорителей Nvidia H100.

«В дальнейшем мы сосредоточимся на разработке более эффективных моделей, которые сохраняют высокую производительность рассуждений, а также на изучении передовых методов повышения эффективности и точности моделей во время тестирования. Следите за обновлениями, пока мы добиваемся прогресса в реализации этих интересных инициатив», — написали разработчики в своём блоге.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Copilot+PC на чипах AMD и Intel наконец получили новые ИИ-функции — на три месяца позже, чем Snapdragon X 2 ч.
Electronic Arts анонсировала открытую «бету» Battlefield 6, а в приложении EA App засветились её подробности 2 ч.
Плохо прогнозируемый эффект от применения ИИ — один из основных барьеров, сдерживающих его использование в промышленности 2 ч.
ИИ-модель Google Gemini получила золотую медаль Международной математической олимпиады 3 ч.
OpenAI раскрыла масштабы популярности ChatGPT: каждый день бот получает 2,5 млрд запросов 13 ч.
Microsoft реализовала на ПК и консолях Xbox кроссплатформенную историю запущенных игр, но пока не для всех 13 ч.
Календарь релизов —21–27 июля: Killing Floor 3, Wuchang: Fallen Feathers и The King is Watching 14 ч.
Дуров призвал сообщать ему о вымогателях в Telegram, охотящихся за подарками — но это не бесплатно 14 ч.
Спустя два года после релиза в Avatar: Frontiers of Pandora всё-таки добавят функции, которые фанаты просили больше всего 15 ч.
Microsoft ускорила запуск приложений Office, но это может замедлить загрузку Windows 16 ч.
Kioxia представила первый в мире NVMe SSD вместимостью 245 Тбайт 6 мин.
Samsung укрепила дисплей Galaxy Z Fold7 — он выдержит в 2,5 раза больше складываний, чем Fold6 25 мин.
Kioxia представила самый ёмкий SSD в мире —  он может вместить 12 500 фильмов в 4K 27 мин.
Прыгающий электромобиль Yangwang U9 и другие модели люксового бренда BYD начнут покорять Европу 31 мин.
Великобритания и OpenAI подписали новое соглашение о стратегическом сотрудничестве 44 мин.
Прототип тихого сверхзвукового авиалайнера NASA X-59 впервые самостоятельно проехал по взлётной полосе — дальше только в небо 59 мин.
«Яндекс» купила 50 % SolidSoft, чтобы создать с ней СП 2 ч.
Новая статья: Безопасный выход в интернет для аэропортов как объектов КИИ: как преодолеть дилемму изоляции и безопасности 3 ч.
Китайская YMTC рассчитывает запустить импортозамещённую производственную линию и к концу 2026 года занять 15 % рынка NAND 4 ч.
Телефон Escobar Fold 2 оказался фальшивкой — создателю бренда грозит 20 лет тюрьмы 4 ч.