Сегодня 18 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В Сети всплыла «ничейная» мощная ИИ-модель — в ней заподозрили разработку DeepSeek

Мощная ИИ-модель без указания авторства, появившаяся недавно на платформе OpenRouter, породила слухи о том, что китайский стартап DeepSeek может в скрытом режиме тестировать свою систему следующего поколения перед официальным запуском. Бесплатная модель под названием Hunter Alpha возникла на OpenRouter 11 марта без какой-либо атрибуции разработчика и позже была промаркирована самой платформой как «скрытая модель».

 Источник изображения: AI

Источник изображения: AI

Во время тестов, проведённых агентством Reuters, чат-бот Hunter Alpha описал себя как китайскую ИИ-модель, обученную преимущественно на китайском языке, и сообщил, что его данные обучения охватывают период до мая 2025 года. Эта дата знаний совпадает с точкой, указанной собственным чат-ботом компании DeepSeek. Однако, когда собеседник спросил о создателе системы, она отказалась идентифицировать разработчика, заявив, что знает только своё имя, масштаб параметров и длину контекстного окна. Ни компания DeepSeek, ни платформа OpenRouter также не назвали создателя модели и не ответили на запросы о комментарии.

Страница профиля Hunter Alpha раскрывает её внушительные технические характеристики: модель обладает 1 трлн параметров, что подразумевает высокие требования к вычислительным мощностям. Кроме того, система поддерживает контекстное окно до 1 млн токенов, позволяя обрабатывать огромные объёмы текста за один сеанс. Инженер, специализирующийся на создании ИИ-агентов, Набиль Хауам (Nabil Haouam), отметил, что сочетание окна в 1 млн токенов, возможностей логического рассуждения и бесплатного доступа сразу бросается в глаза, поскольку аналогичные по характеристикам модели обычно требуют значительных затрат при масштабировании.

Именно эти значения (1 трлн параметров и 1 млн токенов контекста) связывают с грядущей моделью DeepSeek V4, чей выход прогнозируется в апреле. Совпадение породило волну слухов о том, что Hunter Alpha может быть ранней тестовой версией нового продукта китайского стартапа. Анализ модели, также проведённый инженером Дэниелом Дьюхерстом (Daniel Dewhurst), показал, что ключевым сигналом может служить паттерн цепочки рассуждений. По его словам, стиль логических построений, который использует чат-бот, очень трудно подделать, и он обычно отражает метод обучения модели.

Тем не менее не все разделяют эту уверенность. Умур Озкул (Umur Ozkul), проведя независимый бенчмарк, заявил, что его анализ указывает на то, что Hunter Alpha, вероятно, не является DeepSeek V4. Он сослался на различия в поведении, связанном с токенами, и архитектурных паттернах по сравнению с существующими системами DeepSeek.

Независимо от авторства модель быстро набрала популярность. Согласно статистике OpenRouter, по состоянию на воскресенье она обработала более 160 млрд токенов. Значительная часть активности исходила от инструментов разработки и фреймворков для ИИ-агентов. Отметим, что практика анонимного запуска моделей не является чем-то исключительным — это распространённый способ получения разработчиками объективной обратной связи от сообщества.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple научит Siri автоматически удалять переписку ради приватности пользователей 15 мин.
Легендарная СУБД dBase прекратила существование, чуть-чуть не дотянув до полувекового юбилея 28 мин.
В Forza Horizon 6 уже сыграли миллион человек, хотя игра ещё даже официально не вышла 60 мин.
Genmoji в iOS 27 будет предлагать сгенерировать эмодзи на основе пользовательских фото и истории ввода на клавиатуре 3 ч.
Китайские компании превзошли американских конкурентов в сфере генерации видео при помощи ИИ 4 ч.
Мейнфреймы тоже «поржавеют»: для IBM z готовится поддержка Rust в ядре Linux 18 ч.
Microsoft расширила поддержку технологии Advanced Shader Delivery на видеокарты AMD 20 ч.
Konami ограничит доступ к своим игровым серверам для пользователей из России и Белоруссии 23 ч.
Тесты подтвердили: Claude Mythos превосходит конкурентов в поиске уязвимостей, но имеет другие слабые места 17-05 07:21
Новая статья: Subnautica 2 — хорошо на дне морском. Предварительный обзор 17-05 00:04
VoltaGrid привлекла $1 млрд от Blackstone и Halliburton на развитие систем электрогенерации для ЦОД и купила Propell 7 мин.
10 Пбайт в 2U-шасси: Dell и Kixoa анонсировали сервер хранения PowerEdge R7725xd на платформе AMD 2 ч.
SpaceX Dragon доставил на МКС очередную партию грузов и оборудования 2 ч.
Квартальная прибыль CXMT взлетела почти в 18 раз на фоне высокого спроса на память 3 ч.
Новая статья: Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены 10 ч.
NEC завершила прокладку подводной кабельной системы EMCS, связывающей Федеративные Штаты Микронезии, Кирибати и Науру 12 ч.
Huawei запустила продажи восстановленных смартфонов Mate XT и Mate X6 15 ч.
Asus сертифицировала 17 модулей DDR5 — они точно совместимы с платами ROG 17 ч.
Xiaomi подтвердила, что в этом году выпустит новый фирменный процессор серии Xring 18 ч.
Медные водоблоки на основе 3D-печати помогут повысить энергоэффективность ЦОД 19 ч.