Сегодня 04 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Китаю нужна своя OpenAI»: создатель популярного китайского поисковика выложил в открытый доступ мощную ИИ-модель Baichuan-13B

В феврале основатель китайской поисковой службы Sogou (входит в Tencent) Ван Сяочуань (Wang Xiaochuan) написал в соцсети Weibo, что «Китаю нужна своя OpenAI». С реализацией плана предприниматель затягивать не стал — его стартап Baichuan Intelligence создал и выложил в открытый доступ большую языковую модель искусственного интеллекта Baichuan-13B.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

Baichuan считается одним из наиболее многообещающих китайских разработчиков больших языковых моделей — основателем компании является выпускник Университета Цинхуа, который создал поисковую службу Sogou, впоследствии поглощённую местным технологическим гигантом Tencent. Ван покинул Sogou в конце 2021 года. Когда платформа ChatGPT уже стала мировой сенсацией, бизнесмен запустил стартап Baichuan и оперативно собрал инвестиции на $50 млн.

Как следует из названия, обученная на китайском и английском большая языковая модель Baichuan-13B на архитектуре Transformer (она же лежит в основе GPT) имеет 13 млрд параметров — переменных, которые используются при генерации текста. Исходный код платформы выложен на GitHub и оптимизирован для коммерческого использования. Baichuan-13B обучена на 1,4 трлн токенов — для сравнения, модель Meta LlaMa с теми же 13 млрд параметров была обучена на 1 трлн токенов.

Стартап Baichuan развивается с неимоверной скоростью. Открывшаяся в апреле компания к концу месяца расширила штат до 50 человек, а в июне опубликовала первую большую языковую модель Baichuan-7B с 7 млрд параметров. Новая Baichuan-13B доступна бесплатно для учёных и разработчиков, получивших разрешение на её использование в коммерческих целях. Стоит отметить, создатели учли введённые США антикитайские санкции, и модель можно запускать на системах с комплектующими потребительского класса, включая видеокарты NVIDIA GeForce RTX 3090.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google призвала к реформам в области энергетики и внедрению малых модульных реакторов 2 ч.
Утечка полностью рассекретила компактный планшет Microsoft Surface Pro 12 за несколько дней до анонса 2 ч.
Слухи: iPhone 18 Pro получит дисплей без рамок и уменьшенный Dynamic Island 5 ч.
ABI Research: из-за пошлин Трампа США рискуют проиграть Китаю в ИИ-гонке 6 ч.
Новые пошлины США обойдутся Meta в несколько миллиардов долларов — снижать темпы развития ИИ ЦОД компания не намерена 10 ч.
Huawei представила быстрый внешний SSD, который переживёт даже наезд автомобиля 10 ч.
В Рио-де-Жанейро построят крупнейший в Латинской Америке кампус ЦОД Rio AI City 11 ч.
Астрономы обнаружили ещё один фрагмент Луны недалеко от Земли 11 ч.
Volkswagen объявила об отзыве электрофургонов ID.Buzz из-за слишком широких сидений 11 ч.
AWS показала самые слабые темпы роста за пять месяцев, но Amazon по-прежнему намерена вкладываться в развитие ЦОД 11 ч.