Сегодня 27 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Новая статья: Лучшие ИИ-сервисы по версии 3DNews. Часть 1: ИИ-собеседники, генераторы картинок и видео, поисковики

Данные берутся из публикации Лучшие ИИ-сервисы по версии 3DNews. Часть 1: ИИ-собеседники, генераторы картинок и видео, поисковики

Radeon RX 7900 XTX обогнала GeForce RTX 4090 в работе с ИИ-моделью DeepSeek R1

Компания AMD заявила, что её флагманская видеокарта Radeon RX 7900 XTX обеспечивает более высокую производительность по сравнению с GeForce RTX 4090 и RTX 4080 Super в работе с ИИ-моделью DeepSeek R1. По словам генерального менеджера подразделения клиентских процессоров AMD и графики Radeon Дэвида Макафи (David McAfee), их флагман на архитектуре RDNA 3 обходит RTX 4090 до 13 %, а модель RTX 4080 Super — до 34 % в этих задачах.

 Источник изображений: AMD

Источник изображений: AMD

AMD протестировала три видеокарты с несколькими конфигурациями DeepSeek R1. Модель Radeon RX 7900 XTX обеспечила наиболее значительное превосходство над RTX 4090 в работе с ИИ-моделью DeepSeek R1 Distill Qwen 7B (7 млрд параметров), где обошла представителя поколения Ada Lovelace на 13 %. В трёх других конфигурациях LLM карта AMD также оказалась эффективнее конкурента: в двух задачах Distill Llama 8B (8 млрд параметров) её превосходство составило 11 %, а в Distill Qwen 14B (14 млрд параметров) она была на 2 % быстрее. Модель GeForce RTX 4090 оказалась быстрее Radeon RX 7900 XTX лишь в одной конфигурации LLM — Distill Qwen 32B (32 млрд параметров), где её превосходство составило 4 %.

AMD также сравнила ИИ-производительность Radeon RX 7900 XTX с GeForce RTX 4080 Super. В работе с ИИ-моделью DeepSeek R1 Distill Qwen 7B (7 млрд параметров) «красная» карта показала 34-процентное превосходство над конкурентом. В задачах Distill Llama 8B и Distill Qwen 14B преимущество видеокарты AMD сократилось до 27 и 22 % соответственно.

Как пишет портал Tom’s Hardware, результаты тестов, предоставленных AMD, следует воспринимать с некоторой долей скепсиса. Во-первых, речь идёт о внутренних тестах компании, а не о независимых испытаниях. Во-вторых, неизвестно, как были настроены видеокарты Nvidia для этих тестов. В конце концов, не все рабочие нагрузки ИИ требуют использования всех вычислительных возможностей GPU. Например, Stable Diffusion может не задействовать вычисления FP8 или код TensorRT для обработки.

Карты Radeon RX 7900 XTX нечасто применяются в качестве специализированных ускорителей ИИ, однако их архитектура вполне позволяет это делать. RDNA 3 в составе Radeon RX 7900 XTX способна выполнять матричные операции, поддерживая вычисления BF16 и INT8. AMD даже официально использует словосочетание «ускоритель ИИ» в рекламных материалах об архитектуре RDNA 3, чтобы продемонстрировать её возможности в задачах искусственного интеллекта. В составе графического процессора Radeon RX 7900 XTX присутствуют 192 блока ускорения ИИ.

Ранее AMD также опубликовала инструкцию, как использовать новую ИИ-модель DeepSeek R1 на её потребительском аппаратном обеспечении, включая видеокарты Radeon RX 7900 XTX.

AMD показала, как запустить думающую ИИ-модель DeepSeek R1 на обычном ПК

Компания AMD опубликовала инструкции по локальному запуску продвинутой ИИ-модели DeepSeek R1 со способностью к размышлению на пользовательских ПК. Правда, необходима система на процессоре Ryzen с ИИ-ускорителем (NPU) XDNA, либо компьютер с настольной видеокартой Radeon RX 7000. Также для запуска требуется драйвер Adrenalin 25.1.1.

 Источник изображения: AMD

Источник изображения: AMD

Как утверждается, только недавно была представлена «высокоэффективная» малая версия ИИ-модели DeepSeek R1, достаточно компактная для работы на потребительском оборудовании. Стоит отметить, что в целом модели DeepSeek отличаются небольшими запросами к железу — например, модель DeepSeek-V3 изначально обучалась на кластере всего из 2048 ускорителей Nvidia H800.

В инструкции AMD описывается всё, что нужно для локального запуска DeepSeek R1 на пользовательской системе на базе аппаратного обеспечения AMD. В LM Studio есть установщик больших языковых моделей в один клик, специально разработанный для процессоров Ryzen AI. Его же пользователи AMD могут использовать для установки R1. В ролике компания также показывает, как приложение должно быть настроено для конкретного оборудования, а также объясняет, какое максимальное количество параметров LLM поддерживается тем или иным оборудованием.

Последнее в значительной степени зависит от объёма доступной памяти. Например, видеокарты Radeon RX 7600 XT, RX 7700 XT, RX 7800 XT, RX 7900 GRE и RX 7900 XT поддерживают модели до DeepSeek-R1-Distill-Qwen-14B с 14 млрд параметров. Флагманская карта Radeon RX 7900 XTX позволяет запускать модели до DeepSeek-R1-Distill-Qwen-32B с 32 млрд параметров. А модель Radeon RX 7600, имеющая на борту всего 8 Гбайт памяти, поддерживает запуск моделей до DeepSeek-R1-Distill-Llama-8B с 8 млрд параметров.

Ноутбуки на базе процессоров Ryzen 8040 и Ryzen 7040 с 32 Гбайт ОЗУ, а также системы на базе процессоров Ryzen AI 9 HX 370 и Ryzen AI 9 365, оснащённые 24 или 32 Гбайт оперативной памяти, могут запускать модели до DeepSeek-R1-Distill-Llama-14B. Ноутбуки на базе Ryzen AI Max+ 395 поддерживают модели до DeepSeek-R1-Distill-Llama-70B с 70 млрд параметров, но только при наличии 64 или 128 Гбайт ОЗУ. Версии лэптопов с 32 Гбайт памяти могут запускать модели до DeepSeek-R1-Distill-Qwen-32B с 32 млрд параметров.

Новая модель искусственного интеллекта DeepSeek R1 в одночасье покорила мир, поскольку затраты на её обучение оказались в 11 раз ниже, чем у передовых ИИ-моделей конкурентов. Два дня назад она стала причиной рекордной потери рыночной капитализации Nvidia в размере 589 миллиардов долларов. Модель DeepSeek R1 полагается на экстремальные уровни оптимизации, чтобы обеспечить 11-кратный рост эффективности. DeepSeek R1 работает не только на ускорителях Nvidia и AMD, но также сообщается о поддержке ускорителей Huawei Ascend.

Китайский робопёс на колёсиках Lynx показал чудеса ловкости и гибкости при движении по воде и пересечённой местности

Китайская компания DEEP Robotics из Ханчжоу распространила видео передвижения робопса «Рысь» (Lynx) по пересечённой местности. Робопсы стали популярным направлением для разработки, обещая стать новым словом в охране объектов и в операциях по спасению. Но кроме искусственного интеллекта у робота Lynx есть ещё одно преимущество перед живыми собаками — он сочетает перемещение на четырёх конечностях с передвижением на колёсах.

 Источник изображения: DEEP Robotics

Источник изображения: DEEP Robotics

Робопёс способен блокировать колёса на время бега и лазанья. Также этот приём используется для выполнения различных акробатических трюков. Защита класса IP54 обеспечивает ему возможность безопасного перемещения по воде и в пыли. Для преодоления препятствий робопёс может совершать прыжки, а узкие места может проезжать, стоя только на одной ноге (колесе).

Нечто подобное недавно показала компания Unitree Robotics, тоже, кстати, из Ханчжоу. Её робопёс B2 оказался таким же хорошим акробатом и точно так же ловко передвигался по пересечённой местности. Некоторым образом китайские разработчики возглавили направление робототехники, имитирующей движение людей и животных. Но миру нужны не трюкачи или роботы с элегантной походкой, а пожарные, спасатели и бойцы.

Пользователи стали тратить в 37 раз больше на мобильные приложения с ИИ за два года

За последние два года ежемесячный доход разработчиков мобильных приложений с искусственным интеллектом (ИИ) вырос в 37 раз. В частности, в 2024 году пользователи потратили на них $1,4 млрд, сообщил «Коммерсантъ» со ссылкой на доклад аналитической компании Appfigures. Согласно прогнозу аналитиков, в 2025 году расходы пользователей на такие приложения превысят $2 млрд.

 Источник изображения: Growtika/unsplash.com

Источник изображения: Growtika/unsplash.com

С большим отрывом по количеству скачиваний среди ИИ-приложений лидирует ИИ-чат-бот ChatGPT компании OpenAI. Он был представлен в ноябре 2022 года и стал доступен для пользователей в магазинах мобильных приложений в мае 2023 года. С тех пор пользователи смартфонов потратили на него $529 млн, а месячная выручка его разработчика выросла с момента запуска в 75 раз. С июля минувшего года ежемесячный доход от ChatGPT превышает совокупный доход от всех других популярных приложений-помощников в App Store и Play Store.

Наибольшей популярностью среди приложений с ИИ пользуются чат-боты. По итогам последних двух лет умные помощники занимают в рейтинге скачиваний восемь из десяти первых мест.

Большинство пользователей приложений с ИИ — молодые люди, которые относятся к возрастной категории от 18 до 24 лет. При этом львиная доля трат на такие приложения приходится на пользователей из США — 64 % всех трат в мире.

Microsoft заподозрила DeepSeek в обучении ИИ на данных, украденных у OpenAI

Компании Microsoft и OpenAI проведут расследование на предмет того, не совершила ли организация, связанная с китайской лабораторией искусственного интеллекта DeepSeek, кражу данных у OpenAI. Об этом сообщило агентство Bloomberg со ссылкой на собственные источники.

 Источник изображения: deepseek.com

Источник изображения: deepseek.com

Эксперты отдела безопасности Microsoft ещё осенью обратили внимание, что некие лица, которые, по мнению корпорации, могут быть связаны с DeepSeek, запрашивают большие объёмы данных через API OpenAI, рассказали источники Bloomberg. OpenAI продаёт доступ к API — этот инструмент позволяет сторонним разработчикам интегрировать модели искусственного интеллекта OpenAI в свои приложения. Microsoft как технологический партнёр и крупнейший инвестор OpenAI уведомила компанию о происходящем. Эта деятельность может нарушать условия обслуживания OpenAI или указывать, что связанная с китайской лабораторией компания пыталась обойти ограничения на объём данных, который могут получить клиенты OpenAI.

Ранее DeepSeek представила открытую модель ИИ R1, имитирующую ход мыслей человека. Проект всколыхнул рынок, на котором доминируют OpenAI и другие американские компании, в том числе Google и Meta. По словам создателей, модель может конкурировать или превосходит проекты ведущих американских разработчиков, а её обучение обошлось радикально дешевле. В результате возникла угроза американскому доминированию в отрасли ИИ, и в понедельник, 27 января, рыночная капитализация технологических компаний США, включая Microsoft, Nvidia, Oracle и Alphabet, просела почти на $1 трлн.

Накануне, 28 января, советник президента США Дональда Трампа (Donald Trump) по вопросам ИИ Дэвид Сакс (David Sacks) заявил, что есть «существенные доказательства» использования моделей OpenAI при разработке технологий DeepSeek. В интервью господин Сакс рассказал о методе дистилляции, позволяющий одной модели ИИ обучаться на данных другой для развития аналогичных возможностей. «Мы знаем, что компании из КНР — и прочие — постоянно пытаются произвести дистилляцию моделей ведущих американских компаний в области ИИ. Как ведущий разработчик ИИ мы принимаем контрмеры для защиты нашей интеллектуальной собственности, включая тщательный процесс развёртывания передовых возможностей у выпускаемых моделей, и уверены, что по мере движения вперёд критически важно тесно сотрудничать с правительством США, чтобы наиболее эффективным образом защитить самые функциональные модели от попыток неприятеля и конкурентов завладеть американскими технологиями», — прокомментировали заявление Сакса в OpenAI.

ASML успокоила инвесторов превосходным квартальным отчётом — акции вернулись к росту после обвала из-за DeepSeek

По сравнению с другими отчётными периодами, четвёртый квартал вынуждает публичные компании чуть дольше готовить финансовую статистику, но ASML уложилась до конца января, заявив, что объём заказов на её оборудование для производства чипов в денежном выражении вырос до €7,09 млрд, в два с небольшим раза превысив ожидания аналитиков.

 Источник изображения: ASML

Источник изображения: ASML

Генеральный директор нидерландской компании Кристоф Фуке (Christophe Fouquet), комментируя итоги прошлого фискального квартала, пояснил, что «ИИ является очевидным драйвером» финансовых результатов этого поставщика литографических сканеров. Такое оборудование необходимо для выпуска любых полупроводниковых компонентов, а в случае с вычислительными решениями для инфраструктуры ИИ востребованы как раз наиболее дорогие литографические системы этой марки. «Мы искренне верим, что ИИ откроет перед полупроводниковой отраслью ещё большие возможности», — пояснил глава ASML.

Акции ASML успели вырасти на хороших новостях на 12 %, максимально для одной торговой сессии с 2020 года, но ранее на этой неделе капитализация компании сократилась более чем на €19 млрд из-за опасений инвесторов по поводу возможного сокращения расходов производителей чипов на оборудование для их выпуска. Всё из-за успехов китайского стартапа DeepSeek, который показал возможность создавать эффективные языковые модели при умеренных материальных затратах и ограниченных вычислительных ресурсах. В понедельник акции ASML подешевели на 7 %.

Из указанных 7 млрд евро, сформировавших заказы на оборудование ASML в прошлом квартале, на передовые EUV-сканеры пришлось около €3 млрд. При этом санкции против Китая начали неизбежно сказываться на бизнесе ASML в регионе, и если на протяжении основной части прошлого года и части позапрошлого страна была главным источником выручки для компании, то в четвёртом квартале она уступила США и оказалась на втором месте. Важно учитывать, что развитие американской полупроводниковой отрасли тоже способствовало смещению приоритетов в поставках ASML.

В прошлом квартале китайская выручка компании достигла €1,92 млрд или 27 % от совокупной. По итогам текущего года доля Китая в выручке ASML должна опуститься до 20 %, как уже отмечалось ранее. Впрочем, в компании этот процесс называют возвращением к нормальным соотношениям, соответствующим историческим тенденциям. Выручка ASML по итогам текущего года должна уложиться в диапазон до 30 до 35 млрд евро, как считает руководство. По итогам минувшего квартала выручка поставщика достигла €9,26 млрд евро и превысила ожидания рынка, чистая прибыль составила €2,69 млрд и тоже оказалась выше прогноза.

В прошлом квартале ASML получила выручку от поставки ещё двух передовых литографических сканеров класса High-NA EUV, каждый из которых стоит более €350 млн. Кто является их получателями, из-за затяжной логистики и специфики бухгалтерского учёта судить сложно, но Intel и TSMC такие системы уже получать начали. Они позволят им выпускать чипы с литографическими нормами менее 2 нм.

Alibaba представила мощную ИИ-модель Qwen2.5-Max, которая лучше GPT-4o и DeepSeek V3

Alibaba Cloud, облачное подразделение китайской компании Alibaba, анонсировала выпуск обновлённой, крупномасштабной языковой модели Qwen2.5-Max. ИИ-модель основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Новая версия модели отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента. «Qwen2.5-Max демонстрирует значительный прогресс в обработке сложных запросов и предоставлении релевантных ответов», — пишет компания на страницах своего блога.

Qwen2.5-Max была протестирована в ряде ключевых бенчмарков, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Модель показала превосходство над DeepSeek V3 в таких тестах, как Arena-Hard, LiveBench и LiveCodeBench, а также продемонстрировала конкурентоспособные результаты в MMLU-Pro. В сравнении с другими ведущими моделями, такими как GPT-4o и Claude-3.5-Sonnet, Qwen2.5-Max также подтвердила свои лидирующие позиции.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Alibaba Cloud планирует интегрировать Qwen2.5-Max в свои облачные сервисы, что позволит клиентам использовать инструмент для решения широкого спектра задач, включая автоматизацию обработки данных, улучшение взаимодействия с клиентами через чат-ботов и оптимизацию бизнес-процессов.

ИИ-модель уже доступна через сервис Qwen Chat, в котором пользователи могут взаимодействовать с Qwen2.5-Max, тестировать её возможности и экспериментировать с различными функциями. Для разработчиков также открыт программный интерфейс API. Для доступа необходимо зарегистрироваться в Alibaba Cloud, активировать сервис Model Studio и создать API-ключ.

На юпитерианской луне Ио произошло мощнейшее извержение вулкана в Солнечной системе

Во время очередного пролёта спутника Юпитера Ио зонд NASA «Юнона» (Juno) зафиксировал колоссальное извержение вулкана в районе южного полюса луны. Площадь извержения составила до 100 000 км² — это больше крупнейшего из Великих озёр в США. Несколько близко расположенных кратеров извергали магму с энергией, в шесть раз превышающей мощность всех земных электростанций. Детекторы «Юноны» не смогли полностью распознать детали этого явления.

 Инфракрасный снимок южного полюса Ио при пролёте зондом NASA «Юнона» 27 декабря 2024 года. Источник изображения: NASA

Инфракрасный снимок южного полюса Ио при пролёте зондом NASA «Юнона» 27 декабря 2024 года. Источник изображения: NASA

«Хотя всегда приятно стать свидетелем событий, которые переписывают книги рекордов, эта новая горячая точка потенциально может сделать гораздо больше, — говорят специалисты NASA. — Интригующая особенность может улучшить наше понимание вулканизма не только на Ио, но и на других планетах».

Удивительное открытие «Юнона» сделала во время близкого пролёта Ио 27 декабря 2024 года. Это было не самое тесное сближение со спутником: зонд облетает Юпитер, и сближения с Ио не входят в его основные задачи. В декабре «Юнона» пролетела над южным полюсом этой луны на расстоянии 74 400 км. Увиденное поразило учёных. Правее от полюса обнаружилось настоящее «море огня». Позже учёные выяснили, что детекторы инфракрасной камеры частично ослепли из-за мощного излучения, а источников выхода магмы на поверхность оказалось несколько. Детектор Juno Jovian Infrared Auroral Mapper (JIRAM), рассчитанный на изучение атмосферы Юпитера на глубину до 70 км под облачным покровом, испытывает значительные нагрузки при изучении Ио.

Ранее на Ио — самом вулканически активном небесном теле Солнечной системы, которое насчитывает сотни одновременно действующих вулканов, — самый обширный выход магмы занимал площадь до 20 000 км². Новый выход значительно превзошёл предыдущие наблюдения и стал самым мощным извержением вулкана, зарегистрированным в нашей звёздной системе.

 На снимках близких пролётов видно измененние области в зоне извержения за длительное время

На снимках близких пролётов видно изменение поверхности в зоне извержения за длительное время

«JIRAM обнаружил экстремальное инфракрасное излучение — массивную горячую точку — в южном полушарии Ио, настолько сильное, что оно залило наш детектор, — сказал Алессандро Мура (Alessandro Mura), специалист из команды «Юноны» из Национального института астрофизики в Риме. — Однако у нас есть доказательства того, что мы обнаружили на самом деле несколько близко расположенных горячих точек, которые извергались одновременно, что указывает на обширную систему подземных магматических очагов. Данные подтверждают, что это самое интенсивное извержение вулкана, когда-либо зарегистрированное на Ио».

Зонд снова пролетит над этой областью 3 марта 2025 года и сделает снимки извержения или того, что от него осталось. Возможно, за Ио будут вестись наблюдения с Земли. Обнаруженное извержение вышло за рамки ожидаемого и требует более подробного изучения.

Ещё один китайский удар по OpenAI: Alibaba выпустила ИИ, который может управлять ПК и смартфоном

Самой яркой звездой китайской отрасли искусственного интеллекта в последние дни стала лаборатория DeepSeek, но не сидят сложа руки и технологические гиганты: подразделение Alibaba Qwen представило семейство моделей Qwen2.5-VL, способных управлять ПК и смартфоном, как это делает виртуальный помощник OpenAI Operator.

 Источник изображения: alibabacloud.com

Источник изображения: alibabacloud.com

Самая мощная модель в семействе Qwen2.5-VL превзошла крупнейшие американские проекты, в том числе OpenAI GPT-4o, Anthropic Claude 3.5 Sonnet и Google Gemini 2.0 Flash в ряде испытаний, включая «понимание» видео, решение математических задач, анализ документов и ответы на вопросы, утверждают разработчики. Испытать эту модель можно в приложении Alibaba Qwen Chat, доступна её загрузка с платформы Hugging Face. Она анализирует диаграммы и графики, извлекает данные из бухгалтерских документов, изучает многочасовые видео, а также распознаёт фрагменты фильмов и сериалов — возможно, её обучение велось с использованием защищённых авторским правом работ. Как и другие китайские модели, она отказывается комментировать политику Пекина.

 Источник изображения: x.com/_philschmid

Источник изображения: x.com/_philschmid

Одной из наиболее интересных особенностей Qwen2.5-VL является её способность управлять программами на ПК и мобильных устройствах. В одном из примеров модель запустила приложение на Android и забронировала авиабилеты. В другом примере ей поручили управление ПК под Linux, но она смогла совершить лишь базовые действия, в частности, переключала вкладки в браузере. Младшие версии Qwen2.5-VL-3B и Qwen2.5-VL-7B доступны по открытой лицензии без ограничений; флагманская Qwen2.5-VL-72B требует, чтобы владельцы платформ с более чем 100 млн пользователей получали разрешение у Alibaba Qwen перед коммерческим развёртыванием модели.

ИИ-помощник Meta✴ AI будет «запоминать» информацию о пользователях для улучшения рекомендаций

Помощник на базе искусственного интеллекта Meta AI будет «запоминать» определённую информацию о пользователях, например, сведения о диетических предпочтениях и интересах. Собранную таким образом информацию вместе с данными из учётных записей Facebook и Instagram алгоритм будет использовать для предоставления более релевантных рекомендаций.

 Источник изображения: starline / freepik.com

Источник изображения: starline / freepik.com

ИИ-помощник Meta AI получил функцию памяти в конце прошлого года, но на тот момент она была ограничена. Теперь же разработчики объявили о более широком распространении этого нововведения на Facebook, Messenger и WhatsApp для платформ Android и iOS на территории США и Канады. Хотя пользователи могут сами сообщить Meta AI какую-то информацию о себе, он также будет запоминать некоторые данные на основе контекста. Например, если алгоритм предоставит рецепт какого-то блюда с мясом, а пользователь сообщит, что он вегетарианец, то в дальнейшем чат-бот будет корректировать свои ответы с учётом этой особенности.

 Источник изображения: *** AI

Источник изображения: Meta AI

Наряду с этими «воспоминаниями» Meta AI в Facebook, Instagram и Messenger обеспечит «более высокий уровень персонализации», для чего будет задействована информация из учётных записей пользователей на каждой из платформ. Алгоритм учтёт возраст, пол и интересы пользователя, формируемые на основе его действий и просматриваемого контента. Отмечается, что на данный момент компания не предоставляет возможность отказа от функции персонализации контента. По данным компании, ИИ-алгоритм запоминает данные только из персональных бесед с пользователем, но не в групповых чатах. При необходимости можно «в любое время» удалить воспоминания чат-бота.

Трамп и Альтман высоко оценили успехи китайского ИИ-стартапа DeepSeek и заявили, что США смогут лучше

Распространение новейшей языковой модели китайской компании DeepSeek зародило в умах инвесторов сомнения по поводу способности американских компаний и далее удерживать лидерство в сфере ИИ, а главное — доказало, что высокого быстродействия можно добиться при меньших затратах. Президент Дональд Трамп (Donald Trump) и глава OpenAI Сэм Альтман (Sam Altman) похвалили DeepSeek, но подчеркнули, что США способны на большее.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

По крайней мере, в своём выступлении во Флориде Дональд Трамп заявил, что много читал в последние дни о прогрессе китайской компании DeepSeek, которая продемонстрировала современную языковую модель, созданную со значительно меньшими аппаратными и материальными ресурсами по сравнению с американскими разработками. По мнению президента США, подобный прецедент идёт на пользу его стране, поскольку «мы сможем сделать то же самое, при этом не затрачивая так много средств и получая такой же результат, как хотелось бы надеяться». На встрече с политическим руководством Китая, по словам Трампа, он услышал признания заслуг американских учёных. По его мнению, если китайской стороне удалось создать более дешёвую технологию в сфере искусственного интеллекта, американские компании последуют за ней.

Один из основателей и глава OpenAI Сэм Альтман (Sam Altman) заявил со страниц социальной сети X, что «DeepSeek R1 является впечатляющей моделью, особенно с точки зрения соотношения результата и стоимости». Он тут же добавил: «Мы очевидно сможем предложить значительно лучшие модели. Иметь нового конкурента — это реально очень воодушевляет. Мы ускорим выпуск некоторых моделей».

Компания Nvidia также не удержалась от комментариев и накануне тоже выразила восхищение итогами работы DeepSeek, подчеркнув, что подобный высокий результат был достигнут в условиях экспортных ограничений США и относительно небольшого бюджета. «Работа DeepSeek показывает, как могут создаваться новые модели без нарушения экспортного контроля», — говорится в сообщении Nvidia. Рекордное падение капитализации самой Nvidia на фоне успехов DeepSeek представителей компании не расстроило. Напротив, они отметили, что создание искусственного интеллекта с возможностью рассуждения потребует значительных количеств GPU данной марки, а также высокоскоростных телекоммуникационных решений.

Попутно бывший генеральный директор Intel Патрик Гелсингер (Patrick Gelsinher) также положительно оценил достижения как китайской DeepSeek, так и всего ПО с открытым исходным кодом в сфере создания систем искусственного интеллекта. Он отметил, что хотя специфика работы китайских компаний и не позволяет судить об истинной величине затрат DeepSeek на создание своей модели R1, но имеющиеся доказательства говорят о том, что они оказались в 10 или 50 раз ниже, чем в случае с моделью o1 компании OpenAI. По словам Гелсингера, инженеры его собственного стартапа Gloo, создающего чат-бот Kallm, уже используют языковую модель DeepSeek R1, хотя технически у них есть возможность применять o1 компании OpenAI. В дальнейшем Gloo перейдёт на языковую модель с открытым исходным кодом собственной разработки. Как признался Гелсингер, «открытое побеждает, DeepSeek полностью изменит мир всё более закрытых моделей в сфере ИИ». Вычисления, по словам Гелсингера, подчиняются тем же законам, что и газы. Чем дешевле становится ПО, тем сильнее расширяется рынок для его применения.

Посещаемость ИИ-чат-бота DeepSeek взлетела с 300 000 до 6 млн человек, не обошлось и без DDoS

Китайский ИИ-стартап DeepSeek столкнулся с резким ростом интереса к своим продуктам. Согласно данным аналитического сервиса Similarweb, ежедневное количество посещений сайта компании увеличилось с 280 тысяч до 6,2 миллиона. Такой скачок произошёл после выпуска 26 декабря третьей версии их чат-бота V3. В последующие дни трафик начал стремительно расти, достигнув 2 миллионов посещений в день.

 Источник изображения: Unsplash, Faizi Sheikh

Источник изображения: Unsplash, Faizi Sheikh

К началу января ежедневный трафик на сайт DeepSeek достиг 3,1 млн посещений, а к концу недели пересёк отметку в 5 млн. Пик интереса пришёлся на 24 января, когда аналитический сервис Similarweb зафиксировал 6,2 миллиона посещений. Как пишет PCMag, этот рост совпал с распространением информации о том, что технологии DeepSeek могут составить серьёзную конкуренцию американским компаниям на рынке искусственного интеллекта (ИИ). Хотя цифры, касающиеся посещаемости, всё ещё значительно уступают OpenAI, чей чат-бот ежедневно привлекает более 100 миллионов человек, успех DeepSeek очевидно свидетельствует о растущем интересе к разработкам компании.

Отмечается, что одной из причин популярности DeepSeek стали их последние модели V3 и R1, которые требуют значительно меньше вычислительных ресурсов и снижают затраты на их использование. По мнению экспертов, компания использует такие технологии, которые способны нанести удар по бизнес-моделям американских технологических гигантов, таких как Nvidia, OpenAI и Microsoft. «Развёртывание замороженных атомных электростанций никогда не было решением. У нас есть огромные возможности для повышения эффективности ИИ», — выразил своё мнение в Twitter генеральный директор Cloudflare Мэттью Принс (Matthew Prince).

Однако рост популярности DeepSeek привлёк не только пользователей, но и хакеров. Вчера утром компания сообщила о «крупномасштабной злонамеренной атаке» на свой сайт, что даже вынудило её временно ограничить регистрацию новых пользователей.

При этом уже существующие пользователи сохранили доступ к сервису, а DeepSeek временно разрешила регистрацию только для пользователей с китайскими номерами телефонов (+86). Тем не менее, позднее ограничения были смягчены, так как удалось частично справится с техническими трудностями, которые были вызваны DDoS-атакой.

ИИ-пузырь лопнул: стоимость Nvidia рухнула на $600 млрд за сутки из-за китайского стартапа DeepSeek

Понедельник, 27 января 2025 года, войдёт в историю как один из худших дней для технологических компаний со всего мира — акции большинства из них упали на фоне успеха китайского ИИ-стартапа DeepSeek. Хуже всех пришлось компании Nvidia — её капитализация рухнула примерно на $600 млрд, что является крупнейшим обвалом в истории фондового рынка США. И, возможно, это ещё не конец.

 Источник изображения: Nasdaq

Источник изображения: Nasdaq

На момент подготовки данного материала акции Nvidia показывали суточное падение в 17,8 % — для данной компании это самый серьёзный спад с марта 2020 года. Рыночная стоимость крупнейшего производителя ИИ-чипов в мире сократилась на 600 млрд долларов до отметки в 2,89 трлн, что является рекордным падением в истории. Прежний рекорд в 279 млрд также принадлежал Nvidia и произошёл в сентябре 2024 года. Ещё вчера Nvidia была самой дорогой компанией в мире, а уже сегодня скатилась на третье место после Apple и Microsoft, и рискует опуститься ещё ниже.

Примеру ценных бумаг Nvidia последовали акции многих других компаний технологического сектора, так или иначе связанных с ИИ. Акции Broadcom потеряли 17,3 %, AMD — 8 %, Microsoft — 3 %, Palantir — 7 %. Пожалуй, OpenAI повезло, что она не торгуется на бирже, поскольку её акции скорее всего тоже были бы в лидерах падения. Индекс Nasdaq Composite потерял 3,5 %, а индекс S&P 500 упал на 1,8 %. Добавим, что пострадали и компании, не связанные с ИИ напрямую: например, поставщики электроэнергии Constellation Energy и Vistra потеряли за день 21 и 29 % своей стоимости соответственно. Всего фондовый рынок США за день потерял более 1 трлн долларов капитализации.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Почему же инвесторы устроили распродажу акций и обвалили рынки? Всё дело в китайском стартапе DeepSeek, который нашёл способ обучать продвинутые ИИ-модели на малом количестве ускорителей вычислений. Например, при обучении одной из своих моделей на внушительных 671 млрд параметров DeepSeek использовала всего 2048 ИИ-ускорителей Nvidia H800 и потратила $5,6 млн. Это мизерная часть расходов OpenAI и Google на обучение моделей сопоставимого размера.

Кроме того, на прошлой неделе DeepSeek выпустила «рассуждающую» модель ИИ R1, которая превзошла мыслящую OpenAI o1 в важных тестах. Более того, компания опубликовала инструкции, как с минимальными затратами построить большую языковую модель, способную самостоятельно обучаться и совершенствоваться без контроля со стороны человека. Добавим, что многие свои разработки DeepSeek распространяет совершенно бесплатно. Да и платный доступ к наиболее продвинутым её системам оказывается намного дешевле, чем у конкурентов — например, R1 доступна через API компании по цене, которая на 90–95 % ниже, чем у OpenAI o1.

В итоге инвесторы поняли, что нейросети можно обучать не только по схеме «купи и установи как можно больше ускорителей вычислений», но и куда более эффективно на меньшем числе GPU. Это грозит резким падением спроса на продукцию Nvidia, выручка которой более чем на 80 % зависит как раз от ускорителей вычислений.

Ряд аналитиков предрекает Nvidia мрачное будущее и не рекомендуют пока покупать акции компании, хотя цены на них стали заманчивыми. Другие же наоборот уверены, что компания сможет быстро восстановиться, а нынешний спад как раз следует использовать для покупки акций.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Что интересно, сама Nvidia похвалила разработки DeepSeek. Компания отметила, что новая модель DeepSeek R1, является «отличным достижением в области ИИ», которое не нарушает экспортные ограничения США. Заявление также отвергает подозрения некоторых аналитиков и экспертов в том, что китайский стартап не мог совершить тот прорыв, о котором он заявлял.

Вместе с тем в Nvidia отметили, что её ускорители нужны не только для обучения ИИ-моделей, но и для инференса — запуска уже обученных систем. Причём для этого нужно очень много GPU, особенно при большом числе пользователей. «Для инференса требуется значительное количество графических процессоров Nvidia и высокопроизводительные сети», — заявили в компании.

Нашумевший стартап DeepSeek выпустил Janus Pro — мощный ИИ-генератор изображений, который потягается с OpenAI DALL-E 3

Китайская компания DeepSeek, получившая огромную известность благодаря своему ИИ-чат-боту, анонсировала семейство мультимодальных моделей искусственного интеллекта Janus Pro. По заявлению компании, эти алгоритмы, доступные под открытой лицензией MIT, способны генерировать и анализировать изображения лучше, чем OpenAI DALL-E 3, PixArt-alpha и Stable Diffusion XL.

 Источник изображения: hdhAI

Источник изображения: hdhAI

Janus Pro предлагается в версиях, насчитывающих от 1 до 7 миллиардов параметров — чем их больше, тем выше производительность. Флагманская модель Janus Pro 7B, как информирует TechCrunch, успешно продемонстрировала свои возможности в бенчмарках GenEval и DPG-Bench. «Janus Pro превосходит предыдущие универсальные модели и сопоставима, и даже превосходит узкоспециализированные решения других компаний. Простота, гибкость и эффективность делают нашу ИИ-модель кандидатом на новое поколение мультимодальных систем», — говорится в сообщении компании.

Архитектура Janus Pro позволяет не только создавать изображения, но и анализировать их. Однако текущая версия ограничена генерацией картинок с разрешением 384 × 384 пикселей, что ниже стандартов современных моделей. Тем не менее, для компактных ИИ-моделей такие результаты называют впечатляющими, особенно на фоне конкурентов.

 DeepSeek

Источник изображения: DeepSeek

Стоит сказать, успех DeepSeek привлёк широкое внимание после того, как её чат-бот возглавил топ приложений App Store. При этом стартап, финансируемый компанией High-Flyer Capital Management и используя энергоэффективные методы обучения, заставляет аналитиков с Уолл-стрит и ИТ-экспертов сомневаться в том, что США наверняка сохранят лидерство в гонке решений, связанных с искусственным интеллектом. Некоторые также задаются вопросом, сохранится ли текущий ажиотажный спрос на чипы для ИИ, так как DeepSeek использовал совсем другие подходы.

Как отмечают эксперты, революционность Janus Pro — в его универсальности. Он объединяет анализ и генерацию, что редко встречается в моделях такого размера. Хотя разрешение изображений пока не дотягивает до уровня DALL-E 3, открытая лицензия и адаптивность могут ускорить внедрение Janus Pro в коммерческие проекты.


window-new
Soft
Hard
Тренды 🔥
Футуристический шутер La Quimera оказался разработкой создателей Metro — 4A Games провела ребрендинг 3 ч.
Более 6,9 млн записей о россиянах утекло в открытый доступ в январе, сообщил Роскомнадзор 4 ч.
Китайцы представили быстро думающий ИИ Turbo S — он отвечает быстрее DeepSeek 4 ч.
Покемоны нового поколения Pokemon Legends: Z-A выглядят как пришельцы из прошлого, но будоражат фанатов возможностями — первый геймплей 4 ч.
Уязвимость в системе Apple Find My открыла путь к слежке за людьми через любое Bluetooth-устройство 5 ч.
DeepSeek запустил ИИ-революцию в Китае: нашумевший ИИ стали внедрять повсюду с подачи партии 5 ч.
Nvidia выпустила драйвер, который устранит одну из проблем GeForce RTX 50-й серии 5 ч.
«Торрент для запуска ИИ»: вышла утилита для распределённого запуска ИИ-моделей на любом оборудовании 5 ч.
Восточноевропейский менталитет, дух книг Сапковского и 14 дней на захват движений: CD Projekt Red рассказала о создании первого трейлера The Witcher 4 6 ч.
Хакеры нашли и эксплуатировали брешь в «Великом китайском файрволе» — её не удалось залатать с первой попытки 8 ч.