Опрос
|
реклама
Быстрый переход
Microsoft открыла доступ к DeepSeek R1 своим клиентам в GitHub и Azure
30.01.2025 [13:05],
Владимир Мироненко
Компания Microsoft на удивление оперативно предоставила доступ своим клиентам к продвинутой ИИ-модели DeepSeek R1 со способностью к размышлению, пишет The Verge. Теперь она является частью каталога моделей на Azure AI Foundry и GitHub, что позволяет клиентам Microsoft интегрировать её в свои приложения ИИ. ![]() Источник изображения: Solen Feyissa/unsplash.com «Одним из ключевых преимуществ использования DeepSeek R1 или любой другой модели на Azure AI Foundry является скорость, с которой разработчики могут экспериментировать и интегрировать ИИ в свои рабочие процессы», — отметила Аша Шарма (Asha Sharma), корпоративный вице-президент Microsoft по ИИ. По её словам, DeepSeek R1, анонс которой привёл к резкому падению акций многих технологических компаний США на этой неделе из-за возможности обучения с гораздо меньшими затратами по сравнению с ведущими моделями OpenAI, прошла строгие проверки защищённости в формате Red Teaming и безопасности, включая автоматизированные оценки поведения модели и обширные проверки безопасности для снижения потенциальных рисков. Microsoft также вскоре сделает уменьшенную версию R1 доступной для локального запуска на ПК Copilot Plus, и вполне возможно, что R1 появится в других сервисах на базе ИИ от Microsoft. Ранее появились сообщения о том, что OpenAI и Microsoft проводят расследование по поводу возможного использования китайской компанией API OpenAI для обучения своих моделей. Переписки с ИИ-ботом DeepSeek и другие конфиденциальные данные попали в открытый доступ
30.01.2025 [11:44],
Павел Котов
Американская компания Wiz, которая специализируется на вопросах кибербезопасности, рассказала, что обнаружила в открытом доступе базу данных ClickHouse китайской лаборатории искусственного интеллекта DeepSeek — среди имеющейся в ней информации оказалась переписка с чат-ботом и другая конфиденциальная информация. ![]() Источник изображения: wiz.io Эксперты Wiz провели сканирование ресурсов DeepSeek и выяснили, что китайская компания оставила незащищёнными несколько миллионов строк данных. В этом наборе оказались программные ключи API и журналы переписки — DeepSeek сохраняет запросы, которые пользователи отправляют чат-боту с ИИ. Также база содержала значительный объем истории чатов, внутренних данных и конфиденциальной информации, включая эксплуатационные данные, которые позволяли повышать привилегии пользователя без обхода механизмов защиты. Wiz уведомила о своей находке китайскую компанию, и та оперативно закрыла незащищённую информацию. «Они убрали её менее чем за час. Но это было так просто обнаружить, что мы сочли себя не единственными, кто это нашёл», — рассказали в Wiz. В Wiz уточнили, что ClickHouse — разработанная «Яндексом» система управления базами данных с открытым исходным кодом, предназначенная для быстрых аналитических запросов к большим наборам данных. Система широко используется для обработки данных в реальном времени, хранения журналов и аналитики больших данных. Выпущенный DeepSeek виртуальный помощник с ИИ взволновал общественность в Китае и вызвал переполох в США. Китайской компании удалось добиться того же, чего и OpenAI, но при значительно более скромных затратах. Инвесторы в Америке поставили под сомнение устойчивость бизнес-моделей и рентабельность американских гигантов в области ИИ, в том числе Nvidia и Microsoft. К понедельнику приложение DeepSeek обогнало ChatGPT в Apple App Store, что спровоцировало масштабную распродажу акций технологических компаний. Radeon RX 7900 XTX обогнала GeForce RTX 4090 в работе с ИИ-моделью DeepSeek R1
29.01.2025 [23:58],
Николай Хижняк
Компания AMD заявила, что её флагманская видеокарта Radeon RX 7900 XTX обеспечивает более высокую производительность по сравнению с GeForce RTX 4090 и RTX 4080 Super в работе с ИИ-моделью DeepSeek R1. По словам генерального менеджера подразделения клиентских процессоров AMD и графики Radeon Дэвида Макафи (David McAfee), их флагман на архитектуре RDNA 3 обходит RTX 4090 до 13 %, а модель RTX 4080 Super — до 34 % в этих задачах. ![]() Источник изображений: AMD AMD протестировала три видеокарты с несколькими конфигурациями DeepSeek R1. Модель Radeon RX 7900 XTX обеспечила наиболее значительное превосходство над RTX 4090 в работе с ИИ-моделью DeepSeek R1 Distill Qwen 7B (7 млрд параметров), где обошла представителя поколения Ada Lovelace на 13 %. В трёх других конфигурациях LLM карта AMD также оказалась эффективнее конкурента: в двух задачах Distill Llama 8B (8 млрд параметров) её превосходство составило 11 %, а в Distill Qwen 14B (14 млрд параметров) она была на 2 % быстрее. Модель GeForce RTX 4090 оказалась быстрее Radeon RX 7900 XTX лишь в одной конфигурации LLM — Distill Qwen 32B (32 млрд параметров), где её превосходство составило 4 %. AMD также сравнила ИИ-производительность Radeon RX 7900 XTX с GeForce RTX 4080 Super. В работе с ИИ-моделью DeepSeek R1 Distill Qwen 7B (7 млрд параметров) «красная» карта показала 34-процентное превосходство над конкурентом. В задачах Distill Llama 8B и Distill Qwen 14B преимущество видеокарты AMD сократилось до 27 и 22 % соответственно. Как пишет портал Tom’s Hardware, результаты тестов, предоставленных AMD, следует воспринимать с некоторой долей скепсиса. Во-первых, речь идёт о внутренних тестах компании, а не о независимых испытаниях. Во-вторых, неизвестно, как были настроены видеокарты Nvidia для этих тестов. В конце концов, не все рабочие нагрузки ИИ требуют использования всех вычислительных возможностей GPU. Например, Stable Diffusion может не задействовать вычисления FP8 или код TensorRT для обработки. Карты Radeon RX 7900 XTX нечасто применяются в качестве специализированных ускорителей ИИ, однако их архитектура вполне позволяет это делать. RDNA 3 в составе Radeon RX 7900 XTX способна выполнять матричные операции, поддерживая вычисления BF16 и INT8. AMD даже официально использует словосочетание «ускоритель ИИ» в рекламных материалах об архитектуре RDNA 3, чтобы продемонстрировать её возможности в задачах искусственного интеллекта. В составе графического процессора Radeon RX 7900 XTX присутствуют 192 блока ускорения ИИ. Ранее AMD также опубликовала инструкцию, как использовать новую ИИ-модель DeepSeek R1 на её потребительском аппаратном обеспечении, включая видеокарты Radeon RX 7900 XTX. AMD показала, как запустить думающую ИИ-модель DeepSeek R1 на обычном ПК
29.01.2025 [23:13],
Николай Хижняк
Компания AMD опубликовала инструкции по локальному запуску продвинутой ИИ-модели DeepSeek R1 со способностью к размышлению на пользовательских ПК. Правда, необходима система на процессоре Ryzen с ИИ-ускорителем (NPU) XDNA, либо компьютер с настольной видеокартой Radeon RX 7000. Также для запуска требуется драйвер Adrenalin 25.1.1. ![]() Источник изображения: AMD Как утверждается, только недавно была представлена «высокоэффективная» малая версия ИИ-модели DeepSeek R1, достаточно компактная для работы на потребительском оборудовании. Стоит отметить, что в целом модели DeepSeek отличаются небольшими запросами к железу — например, модель DeepSeek-V3 изначально обучалась на кластере всего из 2048 ускорителей Nvidia H800. В инструкции AMD описывается всё, что нужно для локального запуска DeepSeek R1 на пользовательской системе на базе аппаратного обеспечения AMD. В LM Studio есть установщик больших языковых моделей в один клик, специально разработанный для процессоров Ryzen AI. Его же пользователи AMD могут использовать для установки R1. В ролике компания также показывает, как приложение должно быть настроено для конкретного оборудования, а также объясняет, какое максимальное количество параметров LLM поддерживается тем или иным оборудованием. Последнее в значительной степени зависит от объёма доступной памяти. Например, видеокарты Radeon RX 7600 XT, RX 7700 XT, RX 7800 XT, RX 7900 GRE и RX 7900 XT поддерживают модели до DeepSeek-R1-Distill-Qwen-14B с 14 млрд параметров. Флагманская карта Radeon RX 7900 XTX позволяет запускать модели до DeepSeek-R1-Distill-Qwen-32B с 32 млрд параметров. А модель Radeon RX 7600, имеющая на борту всего 8 Гбайт памяти, поддерживает запуск моделей до DeepSeek-R1-Distill-Llama-8B с 8 млрд параметров. Ноутбуки на базе процессоров Ryzen 8040 и Ryzen 7040 с 32 Гбайт ОЗУ, а также системы на базе процессоров Ryzen AI 9 HX 370 и Ryzen AI 9 365, оснащённые 24 или 32 Гбайт оперативной памяти, могут запускать модели до DeepSeek-R1-Distill-Llama-14B. Ноутбуки на базе Ryzen AI Max+ 395 поддерживают модели до DeepSeek-R1-Distill-Llama-70B с 70 млрд параметров, но только при наличии 64 или 128 Гбайт ОЗУ. Версии лэптопов с 32 Гбайт памяти могут запускать модели до DeepSeek-R1-Distill-Qwen-32B с 32 млрд параметров. Новая модель искусственного интеллекта DeepSeek R1 в одночасье покорила мир, поскольку затраты на её обучение оказались в 11 раз ниже, чем у передовых ИИ-моделей конкурентов. Два дня назад она стала причиной рекордной потери рыночной капитализации Nvidia в размере 589 миллиардов долларов. Модель DeepSeek R1 полагается на экстремальные уровни оптимизации, чтобы обеспечить 11-кратный рост эффективности. DeepSeek R1 работает не только на ускорителях Nvidia и AMD, но также сообщается о поддержке ускорителей Huawei Ascend. DeepSeek пропал из App Store и Google Play в Италии — до этого власти решили выяснить, как сервис обрабатывает персональные данные
29.01.2025 [19:06],
Павел Котов
Китайская лаборатория DeepSeek, которая обрела популярность благодаря выпуску революционных моделей искусственного интеллекта, предлагающих возможности, аналогичные американским, но при более скромных затратах на обучение, привлекла внимание итальянских властей — они обеспокоены «возможной угрозой для данных миллионов людей» в стране. Приложение DeepSeek уже исчезло из итальянских разделов App Store и Google Play. ![]() Источник изображения: Solen Feyissa / unsplash.com Приложение DeepSeek стало самым популярным на платформе Apple App Store, и итальянское Управление по защите данных (Garante) обратилось к китайской компании с просьбой предоставить информацию о чат-боте, который может представлять угрозу конфиденциальности жителей страны. Надзорный орган отвечает за применение норм «Общего регламента по защите данных» (GDPR) в Италии. Garante сообщило, что связалось с офисами DeepSeek в Ханчжоу и Пекине и запросило информацию о том, какие персональные данные собирает чат-бот с ИИ. Ведомство поинтересовалось, каковы цели сбора данных и хранятся ли они на серверах, физически расположенных на территории Китая. В «Политике конфиденциальности» DeepSeek действительно указано, что сервис передаёт персональные данные, связанные со страной проживания пользователя, и хранит их «на защищённых серверах, расположенных в Китайской Народной Республике». Однако отмечается, что «это будет делаться в соответствии с требованиями применимых законов о защите данных». Итальянский регулятор также запросил, какие данные используются для обучения системы искусственного интеллекта DeepSeek. Если производится сканирование веб-страниц, то каким образом зарегистрированные и незарегистрированные пользователи информируются об обработке персональных данных. DeepSeek дали 20 дней на ответ Garante. Расследование в отношении китайской лаборатории уже проводят Microsoft и OpenAI; изучать вопрос начали и американские власти. Любопытно, что спустя несколько часов после того, как Garante запросило у DeepSeek информацию об обработке персональных данных, приложение исчезло из итальянских разделов магазинов Apple App Store и Google Play. Официальных комментариев от Apple и Google по этому вопросу не последовало. Microsoft заподозрила DeepSeek в обучении ИИ на данных, украденных у OpenAI
29.01.2025 [12:17],
Павел Котов
Компании Microsoft и OpenAI проведут расследование на предмет того, не совершила ли организация, связанная с китайской лабораторией искусственного интеллекта DeepSeek, кражу данных у OpenAI. Об этом сообщило агентство Bloomberg со ссылкой на собственные источники. ![]() Источник изображения: deepseek.com Эксперты отдела безопасности Microsoft ещё осенью обратили внимание, что некие лица, которые, по мнению корпорации, могут быть связаны с DeepSeek, запрашивают большие объёмы данных через API OpenAI, рассказали источники Bloomberg. OpenAI продаёт доступ к API — этот инструмент позволяет сторонним разработчикам интегрировать модели искусственного интеллекта OpenAI в свои приложения. Microsoft как технологический партнёр и крупнейший инвестор OpenAI уведомила компанию о происходящем. Эта деятельность может нарушать условия обслуживания OpenAI или указывать, что связанная с китайской лабораторией компания пыталась обойти ограничения на объём данных, который могут получить клиенты OpenAI. Ранее DeepSeek представила открытую модель ИИ R1, имитирующую ход мыслей человека. Проект всколыхнул рынок, на котором доминируют OpenAI и другие американские компании, в том числе Google и Meta✴. По словам создателей, модель может конкурировать или превосходит проекты ведущих американских разработчиков, а её обучение обошлось радикально дешевле. В результате возникла угроза американскому доминированию в отрасли ИИ, и в понедельник, 27 января, рыночная капитализация технологических компаний США, включая Microsoft, Nvidia, Oracle и Alphabet, просела почти на $1 трлн. Накануне, 28 января, советник президента США Дональда Трампа (Donald Trump) по вопросам ИИ Дэвид Сакс (David Sacks) заявил, что есть «существенные доказательства» использования моделей OpenAI при разработке технологий DeepSeek. В интервью господин Сакс рассказал о методе дистилляции, позволяющий одной модели ИИ обучаться на данных другой для развития аналогичных возможностей. «Мы знаем, что компании из КНР — и прочие — постоянно пытаются произвести дистилляцию моделей ведущих американских компаний в области ИИ. Как ведущий разработчик ИИ мы принимаем контрмеры для защиты нашей интеллектуальной собственности, включая тщательный процесс развёртывания передовых возможностей у выпускаемых моделей, и уверены, что по мере движения вперёд критически важно тесно сотрудничать с правительством США, чтобы наиболее эффективным образом защитить самые функциональные модели от попыток неприятеля и конкурентов завладеть американскими технологиями», — прокомментировали заявление Сакса в OpenAI. Акции Nvidia подскочили на 9 % после недавнего обрушения и потянули за собой остальной рынок
29.01.2025 [08:01],
Алексей Разин
Успехи китайского стартапа DeepSeek в создании эффективной языковой модели с умеренными затратами на этой неделе были отмечены даже прямыми конкурентами как в сфере бизнеса, так и геополитической. Реакция западного фондового рынка, который первоначально обвалился, на второй день сменилась ростом. Акции Nvidia, например, во вторник успели подорожать почти на 9 %. ![]() Источник изображения: Nvidia Конечно, в случае с Nvidia акциям компании не удалось отыграть всё падение понедельника, которое измерялось 17 %, но смена вектора движения определённо воодушевила инвесторов. В понедельник капитализация Nvidia упала на рекордные $595 млрд. Очевидно, это позволило кому-то приобрести акции компании по более низкой цене, и теперь возобновление роста позволяет рассчитывать на получение прибыли в будущем. Тем более, что по сравнению с началом недели акции Nvidia до сих пор более чем на 9 % дешевле. По сравнению с историческим максимумом, достигнутым в январе, акции Nvidia дешевле на 23 %. Объём торгов этими ценными бумагами в понедельник достиг $562,2 млрд. Количество заявок на покупку оказалось в два раза выше, чем на продажу. Представители Barclays заявили, что доказательства возможности создания эффективных языковых моделей с меньшими затратами в действительности являются благоприятным фактором для эмитентов типа Nvidia, ведь распространение систем искусственного интеллекта за счёт этого только ускорится, а это значит, что продукция компании будет пользоваться стабильным спросом. Как дополняет Reuters, фондовые индексы в целом вернулись к росту во вторник, переварив новости об успехах DeepSeek, но компенсировать недавнее падение они пока не смогли. Акции Oracle выросли в цене на 3,6 % после падения на 13,8 %, в случае с Marvell Technology отскок достиг 3,5 % после падения на 19 %. Ценные бумаги Broadcom подросли в цене на 2,6 % после снижения на 17,4 %. А вот акции ASML в Европе продолжили падение, хотя и ограничились 1 % снижения во вторник после 6 % по итогам понедельника. Китайское ИИ-приложение DeepSeek попало в топы App Store и Google Play в России
29.01.2025 [07:04],
Анжелла Марина
Китайский чат-бот DeepSeek стремительно набирает популярность в России. Приложение вошло в топы App Store и Google Play, обогнав многие известные сервисы. Успех DeepSeek связан с его доступностью в России и хорошей функциональностью, что и привлекло внимание пользователей, но одновременно вызвало беспокойство у конкурентов в США. ![]() Источник изображения: Copilot По данным РБК, 28 января DeepSeek возглавил рейтинг самых популярных приложений в российском App Store. В Google Play, который является наиболее востребованной платформой в России и мире, приложение поднялось со 115-го на 20-е место всего за сутки. При этом число загрузок приложения на территории РФ за неделю выросло в три раза и превысило 43 тысячи, свидетельствуя о растущем интересе к технологиям искусственного интеллекта. DeepSeek представляет из себя чат-бот, созданный на основе большой языковой модели искусственного интеллекта (LLM). Его разработчиком является китайская компания, основанная в 2023 году Лян Вэньфэном (Liang Wenfeng), соучредителем хедж-фонда High-Flyer. ИИ-бот способен генерировать тексты, искать информацию в интернете, расшифровывать диаграммы, писать и форматировать код, а также решать сложные задачи по программированию на таких языках, как C++, Python, Java и других. ИИ-Модель DeepSeek-V3, которая легла в основу чат-бота, была опубликована в конце прошлого года и, согласно технической документации, «продемонстрировала производительность, сопоставимую с ведущими американскими аналогами, но с той лишь разницей, что ресурсов для вычислений потребовалась значительно меньше». Компания использовала графические процессоры Nvidia H800, представляющие из себя менее передовую (замедленную) версию видеокарты H100, специально созданную для Китая в рамках ограничений США. Однако за счёт разработки инновационных алгоритмов удалось достигнуть впечатляющей функциональности. Стоимость аренды Nvidia H800 на обучение модели составила $2 за 1 час и в сумме обошлась компании менее чем в $10 млн. Стоит сказать, что успех DeepSeek вызвал беспокойство у американских технологических гигантов, таких как Microsoft, Alphabet (владелец Google) и Meta✴, так как их затраты на разработку искусственного интеллекта исчисляются сотнями миллиардов долларов. На этом фоне инвесторы засомневались в необходимости высокотехнологичных чипов Nvidia, что даже привело к краткосрочному падению котировок компании почти на 18 % с частичным восстановлением на следующий день (8 %). При этом Nvidia назвала новую китайскую модель DeepSeek R1 существенным достижением в области ИИ, а Сэм Альтман (Sam Altman) признал, что DeepSeek теперь является конкурентом OpenAI. Alibaba представила мощную ИИ-модель Qwen2.5-Max, которая лучше GPT-4o и DeepSeek V3
29.01.2025 [06:04],
Анжелла Марина
Alibaba Cloud, облачное подразделение китайской компании Alibaba, анонсировала выпуск обновлённой, крупномасштабной языковой модели Qwen2.5-Max. ИИ-модель основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования. ![]() Источник изображения: Alibaba Cloud Новая версия модели отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента. «Qwen2.5-Max демонстрирует значительный прогресс в обработке сложных запросов и предоставлении релевантных ответов», — пишет компания на страницах своего блога. Qwen2.5-Max была протестирована в ряде ключевых бенчмарков, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Модель показала превосходство над DeepSeek V3 в таких тестах, как Arena-Hard, LiveBench и LiveCodeBench, а также продемонстрировала конкурентоспособные результаты в MMLU-Pro. В сравнении с другими ведущими моделями, такими как GPT-4o и Claude-3.5-Sonnet, Qwen2.5-Max также подтвердила свои лидирующие позиции. ![]() Источник изображения: Alibaba Cloud ![]() Источник изображения: Alibaba Cloud Alibaba Cloud планирует интегрировать Qwen2.5-Max в свои облачные сервисы, что позволит клиентам использовать инструмент для решения широкого спектра задач, включая автоматизацию обработки данных, улучшение взаимодействия с клиентами через чат-ботов и оптимизацию бизнес-процессов. ИИ-модель уже доступна через сервис Qwen Chat, в котором пользователи могут взаимодействовать с Qwen2.5-Max, тестировать её возможности и экспериментировать с различными функциями. Для разработчиков также открыт программный интерфейс API. Для доступа необходимо зарегистрироваться в Alibaba Cloud, активировать сервис Model Studio и создать API-ключ. Успех DeepSeek ударил по акциям азиатских ИИ-компаний, а глава Nvidia вчера потерял $20 млрд
28.01.2025 [16:51],
Павел Котов
Китайская лаборатория DeepSeek, которая выпустила несколько обученных почти за бесценок моделей искусственного интеллекта, спровоцировала падение акций крупнейших в мире игроков, связанных с отраслью, сообщает Reuters. Досталось и владельцам этих компаний, чьи состояния также уменьшились. ![]() Гендиректор Nvidia Дженсен Хуанг. Источник изображения: nvidia.com Падение акций Nvidia накануне завершилось на отметке 17 % — компания подешевела на $593 млрд, и это крупнейший однодневный спад в истории фондового рынка. Ко вторнику акции Nvidia на торгах во Франкфурте отыграли 6 %, Oracle подорожала на 3,4 %, а Palantir — на 2,97 %. В целом же европейский рынок оказался к технологическим компаниям отнюдь не благосклонным. Advantest, производитель оборудования для тестирования чипов и поставщик Nvidia, накануне потерял 9 % и сегодня ещё 10 %; японский финансовый конгломерат SoftBank Group, который активно инвестирует в технологическую отрасль, подешевел на 5 %. Нидерландский производитель оборудования для выпуска чипов ASML потерял 7,1 % вчера и 1 % сегодня; снижение Schneider Electric, ASM International и Infineon составило от 1,2 % до 4,7 %. На торгах в США акции Broadcom рухнули на 17,4 %, Microsoft подешевела на 2,1 %, холдинг Alphabet к закрытию потерял 4,2 %. Филадельфийский фондовый индекс PHLX Semiconductor Sector упал на 9,2 %, и это антирекорд с марта 2020 года. До свершившегося накануне крупномасштабного падения Nvidia стоимость ценных бумаг компании в 60 раз превышала её прибыль — в индексе S&P 500 этот показатель в среднем равен 22. Положение на рынке сложилось безрадостное: на волне бума ИИ капитализация компаний «великолепной семёрки» (Apple, Microsoft, Alphabet, Amazon, Nvidia, Tesla и Meta✴) выросла на $10 трлн. Сначала инвесторы занимали средства, чтобы покупать эти акции, теперь они продают другие активы, чтобы покрыть убытки. Усугубляет положение широкое присутствие «торговых роботов» — инвесторов, которые принимают решения, исходя из оценки алгоритмами. ![]() Динамика акций «великолепной семёрки» и других компаний индекса S&P 500 с начала 2025 года. Источник изображения: reuters.com Успех DeepSeek губительно отозвался и на личных состояниях владельцев крупнейших технологических компаний: 500 самых богатых людей мира потеряли $108 млрд. Состояние главы Nvidia Дженсена Хуанга (Jensen Huang) сократилось на $20,1 млрд или на 20 %; соучредитель Oracle Ларри Эллисон (Larry Ellison) потерял 12 % своего состояния или $22,6 млрд; глава Dell Майкл Делл (Michael Dell) стал беднее на $13 млрд, а убыток создателя криптобиржи Binance Чанпэна Чжао (Changpeng Zhao) составил $12,1 млрд. Богатейшие люди технологического сектора потеряли $94 млрд, приняв на себя падение примерно 85 % общего падения индекса Bloomberg. Индекс Nasdaq Composite показал снижение на 3,1%, а S&P 500 — на 1,5%. До этого состояния богатейших предпринимателей в технологической сфере на фоне бума ИИ показывали колоссальный рост. С начала 2023 года по минувшую пятницу, 24 января 2025 года, чистый капитал Дженсена Хуанга вырос в 8 раз до $121 млрд; состояние главы Meta✴ Марка Цукерберга (Mark Zuckerberg) за тот же период показало рост на 385 % до $229 млрд; бывший глава Amazon Джефф Безос (Jeff Bezos) стал богаче на 133 % до $254 млрд. И не все они проиграли на фоне успеха DeepSeek: Meta✴ восстановилась после падения в начале торговой сессии, а Марк Цукерберг увеличил состояние на $4,3 млрд; Джефф Безос положил в копилку ещё $632 млн. Трамп и Альтман высоко оценили успехи китайского ИИ-стартапа DeepSeek и заявили, что США смогут лучше
28.01.2025 [10:01],
Алексей Разин
Распространение новейшей языковой модели китайской компании DeepSeek зародило в умах инвесторов сомнения по поводу способности американских компаний и далее удерживать лидерство в сфере ИИ, а главное — доказало, что высокого быстродействия можно добиться при меньших затратах. Президент Дональд Трамп (Donald Trump) и глава OpenAI Сэм Альтман (Sam Altman) похвалили DeepSeek, но подчеркнули, что США способны на большее. ![]() Источник изображения: DeepSeek По крайней мере, в своём выступлении во Флориде Дональд Трамп заявил, что много читал в последние дни о прогрессе китайской компании DeepSeek, которая продемонстрировала современную языковую модель, созданную со значительно меньшими аппаратными и материальными ресурсами по сравнению с американскими разработками. По мнению президента США, подобный прецедент идёт на пользу его стране, поскольку «мы сможем сделать то же самое, при этом не затрачивая так много средств и получая такой же результат, как хотелось бы надеяться». На встрече с политическим руководством Китая, по словам Трампа, он услышал признания заслуг американских учёных. По его мнению, если китайской стороне удалось создать более дешёвую технологию в сфере искусственного интеллекта, американские компании последуют за ней. Один из основателей и глава OpenAI Сэм Альтман (Sam Altman) заявил со страниц социальной сети X, что «DeepSeek R1 является впечатляющей моделью, особенно с точки зрения соотношения результата и стоимости». Он тут же добавил: «Мы очевидно сможем предложить значительно лучшие модели. Иметь нового конкурента — это реально очень воодушевляет. Мы ускорим выпуск некоторых моделей». Компания Nvidia также не удержалась от комментариев и накануне тоже выразила восхищение итогами работы DeepSeek, подчеркнув, что подобный высокий результат был достигнут в условиях экспортных ограничений США и относительно небольшого бюджета. «Работа DeepSeek показывает, как могут создаваться новые модели без нарушения экспортного контроля», — говорится в сообщении Nvidia. Рекордное падение капитализации самой Nvidia на фоне успехов DeepSeek представителей компании не расстроило. Напротив, они отметили, что создание искусственного интеллекта с возможностью рассуждения потребует значительных количеств GPU данной марки, а также высокоскоростных телекоммуникационных решений. Попутно бывший генеральный директор Intel Патрик Гелсингер (Patrick Gelsinher) также положительно оценил достижения как китайской DeepSeek, так и всего ПО с открытым исходным кодом в сфере создания систем искусственного интеллекта. Он отметил, что хотя специфика работы китайских компаний и не позволяет судить об истинной величине затрат DeepSeek на создание своей модели R1, но имеющиеся доказательства говорят о том, что они оказались в 10 или 50 раз ниже, чем в случае с моделью o1 компании OpenAI. По словам Гелсингера, инженеры его собственного стартапа Gloo, создающего чат-бот Kallm, уже используют языковую модель DeepSeek R1, хотя технически у них есть возможность применять o1 компании OpenAI. В дальнейшем Gloo перейдёт на языковую модель с открытым исходным кодом собственной разработки. Как признался Гелсингер, «открытое побеждает, DeepSeek полностью изменит мир всё более закрытых моделей в сфере ИИ». Вычисления, по словам Гелсингера, подчиняются тем же законам, что и газы. Чем дешевле становится ПО, тем сильнее расширяется рынок для его применения. Посещаемость ИИ-чат-бота DeepSeek взлетела с 300 000 до 6 млн человек, не обошлось и без DDoS
28.01.2025 [04:32],
Анжелла Марина
Китайский ИИ-стартап DeepSeek столкнулся с резким ростом интереса к своим продуктам. Согласно данным аналитического сервиса Similarweb, ежедневное количество посещений сайта компании увеличилось с 280 тысяч до 6,2 миллиона. Такой скачок произошёл после выпуска 26 декабря третьей версии их чат-бота V3. В последующие дни трафик начал стремительно расти, достигнув 2 миллионов посещений в день. ![]() Источник изображения: Unsplash, Faizi Sheikh К началу января ежедневный трафик на сайт DeepSeek достиг 3,1 млн посещений, а к концу недели пересёк отметку в 5 млн. Пик интереса пришёлся на 24 января, когда аналитический сервис Similarweb зафиксировал 6,2 миллиона посещений. Как пишет PCMag, этот рост совпал с распространением информации о том, что технологии DeepSeek могут составить серьёзную конкуренцию американским компаниям на рынке искусственного интеллекта (ИИ). Хотя цифры, касающиеся посещаемости, всё ещё значительно уступают OpenAI, чей чат-бот ежедневно привлекает более 100 миллионов человек, успех DeepSeek очевидно свидетельствует о растущем интересе к разработкам компании. Отмечается, что одной из причин популярности DeepSeek стали их последние модели V3 и R1, которые требуют значительно меньше вычислительных ресурсов и снижают затраты на их использование. По мнению экспертов, компания использует такие технологии, которые способны нанести удар по бизнес-моделям американских технологических гигантов, таких как Nvidia, OpenAI и Microsoft. «Развёртывание замороженных атомных электростанций никогда не было решением. У нас есть огромные возможности для повышения эффективности ИИ», — выразил своё мнение в Twitter генеральный директор Cloudflare Мэттью Принс (Matthew Prince). Однако рост популярности DeepSeek привлёк не только пользователей, но и хакеров. Вчера утром компания сообщила о «крупномасштабной злонамеренной атаке» на свой сайт, что даже вынудило её временно ограничить регистрацию новых пользователей. При этом уже существующие пользователи сохранили доступ к сервису, а DeepSeek временно разрешила регистрацию только для пользователей с китайскими номерами телефонов (+86). Тем не менее, позднее ограничения были смягчены, так как удалось частично справится с техническими трудностями, которые были вызваны DDoS-атакой. ИИ-пузырь лопнул: стоимость Nvidia рухнула на $600 млрд за сутки из-за китайского стартапа DeepSeek
28.01.2025 [00:00],
Андрей Созинов
Понедельник, 27 января 2025 года, войдёт в историю как один из худших дней для технологических компаний со всего мира — акции большинства из них упали на фоне успеха китайского ИИ-стартапа DeepSeek. Хуже всех пришлось компании Nvidia — её капитализация рухнула примерно на $600 млрд, что является крупнейшим обвалом в истории фондового рынка США. И, возможно, это ещё не конец. ![]() Источник изображения: Nasdaq На момент подготовки данного материала акции Nvidia показывали суточное падение в 17,8 % — для данной компании это самый серьёзный спад с марта 2020 года. Рыночная стоимость крупнейшего производителя ИИ-чипов в мире сократилась на 600 млрд долларов до отметки в 2,89 трлн, что является рекордным падением в истории. Прежний рекорд в 279 млрд также принадлежал Nvidia и произошёл в сентябре 2024 года. Ещё вчера Nvidia была самой дорогой компанией в мире, а уже сегодня скатилась на третье место после Apple и Microsoft, и рискует опуститься ещё ниже. Примеру ценных бумаг Nvidia последовали акции многих других компаний технологического сектора, так или иначе связанных с ИИ. Акции Broadcom потеряли 17,3 %, AMD — 8 %, Microsoft — 3 %, Palantir — 7 %. Пожалуй, OpenAI повезло, что она не торгуется на бирже, поскольку её акции скорее всего тоже были бы в лидерах падения. Индекс Nasdaq Composite потерял 3,5 %, а индекс S&P 500 упал на 1,8 %. Добавим, что пострадали и компании, не связанные с ИИ напрямую: например, поставщики электроэнергии Constellation Energy и Vistra потеряли за день 21 и 29 % своей стоимости соответственно. Всего фондовый рынок США за день потерял более 1 трлн долларов капитализации. ![]() Источник изображения: Nvidia Почему же инвесторы устроили распродажу акций и обвалили рынки? Всё дело в китайском стартапе DeepSeek, который нашёл способ обучать продвинутые ИИ-модели на малом количестве ускорителей вычислений. Например, при обучении одной из своих моделей на внушительных 671 млрд параметров DeepSeek использовала всего 2048 ИИ-ускорителей Nvidia H800 и потратила $5,6 млн. Это мизерная часть расходов OpenAI и Google на обучение моделей сопоставимого размера. Кроме того, на прошлой неделе DeepSeek выпустила «рассуждающую» модель ИИ R1, которая превзошла мыслящую OpenAI o1 в важных тестах. Более того, компания опубликовала инструкции, как с минимальными затратами построить большую языковую модель, способную самостоятельно обучаться и совершенствоваться без контроля со стороны человека. Добавим, что многие свои разработки DeepSeek распространяет совершенно бесплатно. Да и платный доступ к наиболее продвинутым её системам оказывается намного дешевле, чем у конкурентов — например, R1 доступна через API компании по цене, которая на 90–95 % ниже, чем у OpenAI o1. В итоге инвесторы поняли, что нейросети можно обучать не только по схеме «купи и установи как можно больше ускорителей вычислений», но и куда более эффективно на меньшем числе GPU. Это грозит резким падением спроса на продукцию Nvidia, выручка которой более чем на 80 % зависит как раз от ускорителей вычислений. Ряд аналитиков предрекает Nvidia мрачное будущее и не рекомендуют пока покупать акции компании, хотя цены на них стали заманчивыми. Другие же наоборот уверены, что компания сможет быстро восстановиться, а нынешний спад как раз следует использовать для покупки акций. ![]() Источник изображения: Nvidia Что интересно, сама Nvidia похвалила разработки DeepSeek. Компания отметила, что новая модель DeepSeek R1, является «отличным достижением в области ИИ», которое не нарушает экспортные ограничения США. Заявление также отвергает подозрения некоторых аналитиков и экспертов в том, что китайский стартап не мог совершить тот прорыв, о котором он заявлял. Вместе с тем в Nvidia отметили, что её ускорители нужны не только для обучения ИИ-моделей, но и для инференса — запуска уже обученных систем. Причём для этого нужно очень много GPU, особенно при большом числе пользователей. «Для инференса требуется значительное количество графических процессоров Nvidia и высокопроизводительные сети», — заявили в компании. Нашумевший стартап DeepSeek выпустил Janus Pro — мощный ИИ-генератор изображений, который потягается с OpenAI DALL-E 3
27.01.2025 [22:18],
Анжелла Марина
Китайская компания DeepSeek, получившая огромную известность благодаря своему ИИ-чат-боту, анонсировала семейство мультимодальных моделей искусственного интеллекта Janus Pro. По заявлению компании, эти алгоритмы, доступные под открытой лицензией MIT, способны генерировать и анализировать изображения лучше, чем OpenAI DALL-E 3, PixArt-alpha и Stable Diffusion XL. ![]() Источник изображения: hdhAI Janus Pro предлагается в версиях, насчитывающих от 1 до 7 миллиардов параметров — чем их больше, тем выше производительность. Флагманская модель Janus Pro 7B, как информирует TechCrunch, успешно продемонстрировала свои возможности в бенчмарках GenEval и DPG-Bench. «Janus Pro превосходит предыдущие универсальные модели и сопоставима, и даже превосходит узкоспециализированные решения других компаний. Простота, гибкость и эффективность делают нашу ИИ-модель кандидатом на новое поколение мультимодальных систем», — говорится в сообщении компании. Архитектура Janus Pro позволяет не только создавать изображения, но и анализировать их. Однако текущая версия ограничена генерацией картинок с разрешением 384 × 384 пикселей, что ниже стандартов современных моделей. Тем не менее, для компактных ИИ-моделей такие результаты называют впечатляющими, особенно на фоне конкурентов. ![]() Источник изображения: DeepSeek Стоит сказать, успех DeepSeek привлёк широкое внимание после того, как её чат-бот возглавил топ приложений App Store. При этом стартап, финансируемый компанией High-Flyer Capital Management и используя энергоэффективные методы обучения, заставляет аналитиков с Уолл-стрит и ИТ-экспертов сомневаться в том, что США наверняка сохранят лидерство в гонке решений, связанных с искусственным интеллектом. Некоторые также задаются вопросом, сохранится ли текущий ажиотажный спрос на чипы для ИИ, так как DeepSeek использовал совсем другие подходы. Как отмечают эксперты, революционность Janus Pro — в его универсальности. Он объединяет анализ и генерацию, что редко встречается в моделях такого размера. Хотя разрешение изображений пока не дотягивает до уровня DALL-E 3, открытая лицензия и адаптивность могут ускорить внедрение Janus Pro в коммерческие проекты. Nvidia потеряла $384 млрд рыночной стоимости за день из-за шумихи вокруг китайского ИИ-стартапа DeepSeek
27.01.2025 [13:50],
Алексей Разин
Приложение китайского стартапа DeepSeek для работы с фирменным ИИ-чат-ботом по своей популярности успело обойти в Apple App Store знаменитый ChatGPT. Это пошатнуло веру инвесторов в могущество американской ИИ-отрасли — курсы акций многих западных компаний, включая Nvidia и ASML, начали ощутимо снижаться в цене в понедельник. ![]() Источник изображения: Nvidia Откровением для участников фондового рынка стала способность китайской компании предложить сопоставимый по быстродействию с ChatGPT чат-бот с ИИ не только бесплатно для пользователей, но и с гораздо меньшими затратами для самого разработчика. Получается, что для создания эффективных языковых моделей можно ограничиться гораздо более скромными аппаратными ресурсами и материальными затратами. На предварительных торгах в понедельник акций Nvidia падали в моменте на величину свыше 11 %, из-за чего капитализация компании просела на 384 млрд долларов. Ценные бумаги ASML просели на 11 %, что является новым антирекордом для одной торговой сессии за период с 15 октября прошлого года. Фьючерсы на технологический индекс Nasdaq 100 также потеряли в цене. Как известно, Nvidia на протяжении последних двух с лишним лет считается одним из главных бенефициаров так называемого бума искусственного интеллекта, поскольку разрабатывает и поставляет ускорители для соответствующих вычислительных систем. ASML, которая на этой неделе должна опубликовать свой квартальный отчёт, является крупнейшим поставщиком литографических сканеров, которые нужны для выпуска чипов, используемых в вычислительной инфраструктуре. Активность американских компаний и властей в сфере развития подобной инфраструктуры в последние дни широко освещалась в прессе. Так, компания Meta✴ Platforms заявила о готовности потратить на строительство центров обработки данных до $65 млрд. Анонсированный при участии президента США Дональда Трампа (Donald Trump) проект Stargate подразумевал инвестиции в сумме до $500 млрд в последующие четыре года. Всё указывало на то, что для сохранения своего лидерства в сфере искусственного интеллекта США не остановятся перед высокими расходами. Прорыв DeepSeek доказал, что они не всегда требуются, если сосредоточиться на оптимизации ПО в условиях ограниченности ресурсов. Если все игроки отрасли осознают данный дисбаланс, потребность в продукции тех же ASML и Nvidia может быть пересмотрена в сторону уменьшения. Это и толкает акции западных компаний технологического сектора вниз на торгах в понедельник. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |