|
Опрос
|
реклама
Быстрый переход
В OpenAI введён «красный код»: Альтман требует бросить все силы на срочное улучшение ChatGPT
02.12.2025 [12:00],
Алексей Разин
Успехи Google и других разработчиков систем генеративного искусственного интеллекта не позволяют OpenAI спокойно наблюдать за их прогрессом. Поэтому в недавней корпоративной рассылке глава компании Сэм Альтман (Sam Altman) объявил сотрудникам о введении «красного кода» и необходимости мобилизовать все ресурсы, чтобы улучшить ChatGPT. Концентрация на таком приоритете замедлит реализацию некоторых инициатив и проектов.
Источник изображения: Unsplash, Levart_Photographer Краткое содержание корпоративной рассылки OpenAI приводит The Wall Street Jounral. Альтман заявил подчинённым, что следует на ежедневной основе работать над совершенствованием ChatGPT, а особое внимание уделить функциям персонализации для пользователей, повышению быстродействия и надёжности, а также расширению перечня тем, на которые пользователи могут вести с этим чат-ботом беседы. По всей видимости, время для такого обращения к сотрудникам руководитель OpenAI выбрал неслучайно, ведь в прошлом месяце вышла новая версия Gemini корпорации Google, а в августе был представлен генератор изображений Nano Banana, что в совокупности позволило Google увеличить количество активных пользователей с 450 млн в июле до 650 млн человек в октябре. Anthropic тоже оказывает на OpenAI конкурентное давление, особенно в корпоративном секторе. Инвесторы тоже начали нервничать, наблюдая, как активно в этом году OpenAI стягивает сотни миллиардов долларов к своим схемам с кольцевым финансированием и круговой порукой, причём сам стартап ничем особо не рискует. Все это подталкивает руководство OpenAI к скорейшей демонстрации новых успехов с внятным потенциалом монетизации. Выходить на IPO компания пока не торопится, а потому её финансовые потоки всецело зависят от крупнейших партнёров типа Nvidia, Microsoft, Oracle и SoftBank. Альтман пояснил сотрудникам OpenAI, что придётся отложить в сторону работу над созданием ИИ-агентов для сферы здравоохранения и шопинга, персонального ассистента Pulse и реализации проекта в сфере рекламы. В соответствии с новыми приоритетами будут проведены структурные изменения в группах разработчиков, а совещания с отчётностью об улучшениях в ChatGPT станут ежедневными. Стартап намерен сделать этот чат-бот более интуитивным и персональным. При текущих уровнях расходов OpenAI должна к 2030 году получать до $200 млрд выручки, чтобы выйти на окупаемость. В отличие от той же Google, у OpenAI нет других стабильно приносящих прибыль направлений деятельности, а её выручка растёт не так быстро, как расходы. Альтман поспешил успокоить сотрудников, что на следующей неделе OpenAI представит новую рассуждающую ИИ-модель, которая обойдёт по быстродействию решения Google, да и на прочих направлениях деятельности дела у неё идут вполне успешно. Как поясняют источники, для OpenAI это не первый случай объявления повышенного уровня опасности. По существующей корпоративной шкале, уровни тревоги варьируются от жёлтого через оранжевый к высочайшему красному, но последний до сих пор никогда не объявлялся — максимумом был оранжевый. ByteDance выпустила голосового ИИ-помощника для китайских смартфонов
02.12.2025 [10:05],
Владимир Мироненко
Китайская компания ByteDance, разработчик видеосервиса TikTok, сообщила о выпуске голосового помощника на базе большой языковой модели Doubao собственной разработки. Он входит в предустановленное программное обеспечение смартфона Nubia M153 компании ZTE и в дальнейшем станет доступен и на смартфонах других производителей, пишет Reuters.
Источник изображения: Kelli McClintock/unsplash.com ИИ-помощник от ByteDance позволяет пользователям управлять смартфоном с помощью голосовых команд, например, находить контент и бронировать билеты. Он будет конкурировать с аналогичными умными ассистентами, представленными китайскими производителями смартфонов, такими как Huawei и Xiaomi. Компания ByteDance заявила, что у неё нет планов разрабатывать собственные смартфоны, и сейчас она ведёт переговоры с несколькими производителями телефонов об использовании её ИИ-помощника на выпускаемых ими устройствах. ByteDance стала лидером на рынке потребительских ИИ-приложений в Китае благодаря выпуску ИИ-чат-бота Doubao. Doubao — самый популярный чат-бот с искусственным интеллектом в Китае. По данным платформы отслеживания ИИ-приложений Aicpb.com, в октябре у Doubao было 159 млн активных пользователей в месяц, что значительно больше, чем у Tencent Yuanbao с 73 млн пользователей и DeepSeek с 72 млн человек. Установленный на телефоне, Doubao работает на уровне операционной системы, позволяя ИИ видеть, что происходит на экране, и использовать приложения, выполняя такие задачи, как извлечение и упорядочивание файлов, заполнение веб-форм, поиск предложений ресторанов, соответствующих бюджету и предпочтениям пользователя. Apple нашла виноватого в провалах в ИИ — теперь делать Siri умнее будет создатель Google Gemini
02.12.2025 [10:04],
Алексей Разин
Даже неискушённому наблюдателю было очевидно, что на фоне большинства конкурентов компания Apple не демонстрировала явных достижений в развитии собственных компетенций на направлении искусственного интеллекта. Слухи о предстоящем увольнении Джона Джаннандреа (John Giannandrea), который им руководил, ходили давно, и на этой неделе соответствующее кадровое изменение произошло.
Источник изображения: Apple Как отмечает The Guardian, об отставке Джона компания Apple официально сообщила в минувший понедельник, поблагодарив его за семилетний период работы в компании. Место Джаннандреа в Apple теперь займёт опытный исследователь в сфере искусственного интеллекта Амар Субраманья (Amar Subramanya). Дебютировав ещё летом 2024 года, комплекс технологий Apple Intelligence развивался недостаточно быстро на фоне конкурентов, по многим критериям существенно отставал от них, а по-настоящему революционные функции требовали от специалистов длительной разработки. Голосовой интерфейс Siri переводился на рельсы ИИ слишком долго, и руководство Apple объясняло это необходимостью довести эту работу до требуемых корпоративных стандартов качества. В итоге выход обновлённого Siri был отложен на весну следующего года. Преемник Джона Джаннандреа на посту руководителя ИИ в Apple — Амар Субраманья, до перехода в компанию успел поработать корпоративным вице-президентом по ИИ в Microsoft, а также потратил 16 лет карьеры в Google, где возглавлял разработку ИИ-ассистента Gemini, считающегося сейчас лидирующим в отрасли решением. Возможно, его опыт позволит Apple выправить ситуацию с отставанием от конкурентов в сфере ИИ. Амар будет подчиняться главе разработок Крейгу Федериги (Craig Federighi), которому в последние годы добавили полномочий в этой области. Ничего святого: Microsoft представила новый «уродливый» рождественский свитер с логотипом Copilot
02.12.2025 [09:59],
Алексей Разин
Корпорация Microsoft регулярно подыгрывает западной традиции дарить друг другу на Рождество и Новый год свитеры с нарочито уродливыми орнаментами, предлагая подобные предметы одежды в фирменном интернет-магазине. Наступающий сезон предпраздничных распродаж не стал исключением, и в новой редакции фирменного свитера давно знакомые пользователям символы пополнились стилизованным логотипом Copilot.
Источник изображения: Microsoft Как подчёркивает PC Gamer, сам по себе одноимённый ИИ-ассистент на платформе Windows приживается не очень успешно, поэтому помещение его в один ряд с «фирменными тотемами» довольно спорно, и может объясняться лишь желанием маркетологов Microsoft верить в успех этого сервиса. Второй проблемой является не самая удачная графическая адаптация логотипа Copilot, который узнаваем главным образом в высоком разрешении, а «пиксельная графика» машинной вышивки вынуждает приводить используемые на свитере символы к некоему «общему знаменателю». Голубоватое пятно в районе правого локтевого сгиба в итоге выглядит не очень презентабельно. Центральную часть экспозиции, если так можно выразиться, занимает «скрепыш» (Clippy), который после длительного перерыва был возвращён Microsoft для реализации функций искусственного интеллекта. Один из самых узнаваемых персонажей игры Minecraft тоже не обделён вниманием, а ещё упоминается юбилейная дата, поэтому в целом актуализацию орнамента фирменного свитера Microsoft можно считать условно успешной. В интернет-магазине компании этот предмет одежды можно приобрести почти за $80. Вышел генератор HD-видео Runway Gen 4.5 — и он сразу обошёл Veo 3 и Sora 2 Pro
02.12.2025 [07:00],
Алексей Разин
Развитие сегмента сервисов, позволяющих генерировать видео по текстовому описанию, перестало вызывать снисходительную улыбку у «старожилов отрасли», поскольку подобные инструменты теперь позволяют создавать реалистичные ролики малыми затратами. Runway утверждает, что её модель Gen-4.5 выводит реалистичность генерируемых ИИ видео на качественно новый уровень.
Источник изображения: YouTube, Runway В блоге Runway, как отмечает The Verge, сообщает о «результатах кинематографического качества». Внимание уделяется не только точности визуального отображения пейзажей, людей, животных и объектов, но и тщательной проработке физики движущихся объектов. Даже поведение жидкостей реализовано настолько реалистично, что неискушённому зрителю сложно догадаться, что видео было сгенерировано искусственным интеллектом. Распространение Runway Gen-4.5 осуществляется постепенно среди всех пользователей сервиса, по быстродействию и эффективности новая модель не будет уступать предыдущей, по словам представителей компании. Тем не менее, некоторые недостатки в её работе пока наблюдаются, в основном они связаны с логикой взаимодействия объектов на видео. Например, дверь может открываться до того, как кто-то в кадре взялся за её ручку. Создатели Runway утверждают, что новая модель лучше адаптирует генерируемое видео под стилистические запросы в описании и может добиваться более зрелищных визуальных эффектов, которые практически неотличимы от реальных видеосъёмок. Конкурирующая OpenAI тоже активно совершенствует свои средства для генерации видео. В сентябре была выпущена модель Sora 2, которая продемонстрировала заметный прогресс в улучшении отображения физических процессов. По словам создателей, она способна реалистично воспроизводить трюки, выполняемые с сапбордом на поверхности воды. Однако новый генератор Runway Gen 4.5 превзошёл главных конкурентов в лице Google Veo 3 и OpenAI Sora 2 Pro и возглавил рейтинг ИИ-моделей для генерации видео по текстовым описаниям Video Arena от Artificial Analysis. DeepSeek ответил на GPT-5 и Gemini 3 Pro — представлены мощные ИИ-модели DeepSeek-V3.2
02.12.2025 [00:37],
Андрей Созинов
Китайский стартап DeepSeek выпустил две новые открытые модели с мощными возможностями для рассуждений — DeepSeek-V3.2 и усиленную DeepSeek-V3.2-Speciale. Таким образом компания подтвердила, что Китай играет на равных с американскими лидерами в лице OpenAI и Google. По тестам разработчиков, модели достигают уровня GPT-5 и Gemini 3 Pro в программировании и математике. Так, DeepSeek-V3.2-Speciale взяла «золото» на Международной математической олимпиаде, Китайской математической олимпиаде, Международной студенческой олимпиаде по программированию и Международной олимпиаде по информатике. На Американском отборочном экзамене по математике DeepSeek-V3.2-Speciale показала результат в 96,0 %, тогда как GPT-5 High набрала 94,6 %, а Gemini 3 Pro — 95,0 %. В свою очередь в тесте SWE Verified, измеряющем способности ИИ к программированию, китайская новинка набрала 73,1 % (результат GPT-5 High — 74,9 %; Gemini 3 Pro — 76,2 %). DeepSeek утверждает, что модели серии V3.2 — это её первые нейросети, созданные для ИИ-агентов. Компания заявляет, что DeepSeek V3.2 обеспечивает производительность уровня GPT 5 при выполнении общих задач. Китайский стартап также утверждает, что DeepSeek-V3.2-Speciale обладает способностями к рассуждению, сопоставимыми с новейшей моделью Gemini 3 Pro от Google, особенно в сложных сценариях решения проблем. DeepSeek добился прорыва за счёт двух приёмов: масштабного дообучения модели с подкреплением на специально сгенерированных сложных задачах, а также DeepSeek Sparse Attention (DSA) — подходу, когда модель не перебирает все токены, а выделяет для работы только самые важные. DeepSeek-V3.2 уже доступна в приложении, на веб-сайте и в API-сервисах компании. К продвинутой V3.2-Speciale сейчас можно обращаться только через API, она предлагает максимальную мощность рассуждений для сложных задач. Китайские модели от DeepSeek или Alibaba теснят решения ведущих американских разработчиков. Согласно исследованию MIT и Hugging Face, доля скачиваний новых открытых моделей по состоянию на август выросла до 17 % у китайских разработчиков против 15,8 % у американских. Успех китайских игроков опирается на быстрый цикл обновления и фокус на открытых и эффективных моделях, которые работают на менее мощном оборудовании. Новые модели DeepSeek вышли спустя два месяца после экспериментальной V3.2-Exp и способны вновь усилить позиции Китая в ИИ-гонке. Новейшую ИИ-модель Google Gemini 3 Pro взломали всего за пять минут
01.12.2025 [14:59],
Владимир Мироненко
Специалисты стартапа Aim Intelligence, тестирующего ИИ-системы на уязвимости, провели стресс-тест Gemini 3 Pro, новейшей модели Google, представленной в прошлом месяце. Как сообщает газета Maeil Business, исследователям потребовалось всего пять минут, чтобы обойти защиту программного комплекса.
Источник изображения: blog.google После взлома исследователи попросили Gemini 3 предоставить инструкции по созданию вируса оспы, и в ответ модель предоставила множество подробных советов, которые команда назвала «практически выполнимыми». И это был не единственный промах. Исследователи предложили модели подготовить сатирическую презентацию об уязвимости собственной системы безопасности. Gemini ответила презентацией под названием Excused Stupid Gemini 3 («Оправданный глупый Gemini 3»). Затем команда воспользовалась инструментами кодирования Gemini для создания веб-сайта с инструкциями по изготовлению газа зарин и самодельной взрывчатки. Подобный контент модель никогда не должна предоставлять, но в обоих случаях, как сообщается, система не только обошла запреты, но и проигнорировала собственные правила безопасности. Тестировщики сообщили, что это не только проблема Gemini. Разработчики развивают новые модели настолько быстро, что не успевают подготовить соответствующие меры безопасности. В частности, эти модели не просто дают советы с нарушением правил безопасности, они ещё и пытаются избежать обнаружения этого. В Aim Intelligence сообщили, что Gemini 3 может для этого использовать обходные стратегии и подсказки по маскировке, что снижает эффективность предпринимаемых мер предосторожности. В России резко вырос спрос на специалистов по общению с нейросетями
01.12.2025 [14:13],
Владимир Мироненко
За десять месяцев 2025 года количество вакансий для специалистов с навыками написания задач для нейросетей (промптов) увеличилось на 52 %, пишет «Коммерсантъ» со ссылкой на данные рекрутингового сервиса HeadHunter. Средняя зарплата promt-специалистов составляет почти 140 тыс. руб. и может достигать 320,7 тыс. руб. и выше.
Источник изображения: Campaign Creators/unsplash.com За этот период число вакансий специалистов данного профиля выросло до более 1,3 тыс., а количество резюме соискателей — в 3,1 раза. Больше всего предложений о работе было зафиксировано в Центральном федеральном округе — 74 % всех вакансий. Далее следуют Северо-Западный (12 %) и Приволжский (6 %) округи. По данным HeadHunter, медианная зарплата prompt-специалистов составила 138,9 тыс. руб., в Москве они в среднем получают 171 тыс. руб., в Санкт-Петербурге — 121,7 тыс. руб. На старте карьеры их заработок составляет от 60 тыс. руб. По словам независимого эксперта в сфере искусственного интеллекта Алексея Лерона, востребованность в promt-специалистах связана с тем, что с их помощью можно ускорять бизнес-процессы, снижать издержки, повышать скорость вывода продуктов на рынок и улучшать обслуживание клиентов. Также с ростом спроса на promt-специалистов появились обучающие курсы для работы с ИИ. Стоимость курса по базовым навыкам работы с ИИ может составлять 15–30 тыс. руб., профессиональные курсы для продвинутой работы с ИИ-моделями обойдутся в 100 тыс. руб., сообщил эксперт центра искусственного интеллекта «СКБ Контур» Дмитрий Иванков. По словам владельца группы продуктов Sastav Антона Михайлова, экономический эффект от деятельности таких специалистов зависит от масштаба компании, и того, как именно она использует нейросети. Он отметил, что грамотный promt-специалист может снизить затраты времени на рутинную интеллектуальную работу минимум на 10 %, что эквивалентно 1,5 «полной ставки». Экономия фонда зарплаты в компании с численностью 15 человек и средней зарплатой около 150 тыс. руб. может составить примерно 2,5–3 млн руб. в год. Это возможно при «зрелом подходе», иначе появляются риски в виде, например, некачественных решений, предупредил Михайлов. По мнению гендиректора АНО «Национальный центр компетенций по информационным системам управления холдингом» Кирилла Семиона, рост спроса на promt-специалистов — временная тенденция, так как компаниям вскоре станет понятно, что эффективнее дать такие навыки своим уже имеющимся сотрудникам. Павел Дуров запустил децентрализованную вычислительную сеть Cocoon с «ИИчком»
01.12.2025 [10:50],
Владимир Мироненко
Основатель Telegram Павел Дуров объявил в своём Telegram-канале о запуске децентрализованной вычислительной сети Cocoon, представленной в октябре на форуме Blockchain Life 2025 в Дубае. Через неё уже проходит часть запросов Telegram, связанных с автоматическим переводом сообщений, добавил он.
Источник изображения: Telegram Дуров подчеркнул, что сеть Cocoon обеспечивает 100-процентную конфиденциальность при работе с ИИ-технологиями. Для разработчиков она станет более доступной альтернативой сервисам централизованных провайдеров вроде Microsoft или Amazon, предоставляя доступ к вычислительным ресурсам по более низким расценкам. А для владельцев видеокарт — источником дополнительного заработка, поскольку, подключая своё оборудование к Cocoon, они будут получать вознаграждение в Toncoin (TON) в реальном времени. Основатель Telegram отметил, что крупные централизованные провайдеры вычислительных сервисов являются дорогостоящими посредниками, повышающими цены и снижающими уровень конфиденциальности. «Cocoon решает как экономические, так и конфиденциальные проблемы, связанные с традиционными поставщиками вычислений на базе ИИ», — заявил он. Дуров также сообщил о планах масштабировать сеть, наращивая предложение вычислительных мощностей и расширяя функциональность на основе ИИ с обеспечением 100-процентной конфиденциальности, добавив, что документация и исходный код проекта находятся в открытом доступе. «Cocoon вернёт контроль и приватность туда, где они должны быть — к пользователям», — подытожил Павел Дуров. А в качестве логотипа сети Cacoon разработчики выбрали яйцо, или как выразился сам Дуров: «ИИчко». Дешёвых SSD больше не будет: дефицит усиливается, а производители даже и не думают наращивать выпуск флеш-памяти
01.12.2025 [09:55],
Алексей Разин
Оперативная память не стала единственной жертвой бума ИИ, вслед за ней владельцы ЦОД кинулись скупать жёсткие диски, а когда их перестало хватать, переключились на твердотельные накопители (SSD). По данным Fudzilla, дефицит накопителей этого типа только усиливается, цены растут, а производители не торопятся наращивать объёмы выпуска.
Источник изображения: Samsung Electronics Как уже отмечалось недавно, SK hynix намеревается перепрофилировать часть мощностей, изначально ориентированных на выпуск твердотельной памяти NAND, под производство более выгодной оперативной DRAM, включая HBM. Конкурирующая Samsung Electronics, по словам Fudzilla, занимается тем же самым. Период дешёвых SSD в рознице миновал, и цены растут даже за пределами серверного сегмента. В последнем, как отмечает источник, стоимость SSD увеличивается на десятки процентов. Модели ёмкостью от 8 до 30 Тбайт выросли в цене на 25–40 %. Даже по таким ценам владельцы ЦОД скупают накопители, опасаясь дефицита, который поставит под сомнение перспективу своевременной реализации проектов на десятки миллиардов долларов. При этом производители накопителей не торопятся наращивать объёмы выпуска для лучшего покрытия спроса. Недавний затяжной период перепроизводства подорвал их финансовые ресурсы, и возросшие цены создают благоприятные условия для получения некоторого рода компенсации за прошлые неудачи. В любом случае, ввести в строй дополнительные мощности получится за полтора или два года, поэтому моментально нарастить объёмы производства SSD заинтересованные компании всё равно не смогли бы. Глава Google пояснил, что вайб-кодинг хорош, но не для всех сфер применения
01.12.2025 [04:52],
Алексей Разин
Под вайб-кодингом принято понимать процесс написания приложений, который не требует от участников познаний в сфере программирования. Код создаётся системой на базе искусственного интеллекта, а человек просто на естественном языке формулирует техническое задание. Глава Google признался, что у этого подхода есть масса преимуществ, но нельзя забывать и об ограничениях.
Источник изображения: Google Blog Сундар Пичаи (Sundar Pichai) в ходе недавнего подкаста сравнил распространение вайб-кодинга с подъёмом, который наблюдался с появлением YouTube или блогинга, когда в соответствующие сферы деятельности были привлечены многие люди без профильного опыта. Во-первых, генеральный директор Google пояснил, что вайб-кодинг делает процесс более приятным и доступным, поскольку авторам идей не требуется возиться с синтаксисом и вылавливать ошибки в программном коде. Во-вторых, специалисты в узких областях теперь не ждут помощи от программистов, предлагая собственные приложения, ускоряющие собственную работу. Эффект от этих изменений Google уже чувствует в собственной корпоративной структуре. Офисные сотрудники типа бухгалтеров и специалистов по кадрам самостоятельно разрабатывают приложения, которые облегчают их труд. Подобные разработки нередко демонстрируются руководителям, а те уже принимают решение об их внедрении на качественно ином уровне реализации. Глава и основатель Meta✴✴ Platforms Марк Цукерберг (Mark Zuckerberg), по данным TechCrunch, также регулярно просматривает прототипы приложений, созданные сотрудниками компании без опыта программирования. При этом, как подчёркивает Пичаи, подобная работа остаётся довольно скромной в масштабах Google и узко сконцентрированной. Он считает, что пока нельзя доверять ИИ работу с крупными базами кода, применяемого в критических областях деятельности. На этих направлениях за разработку кода и его отладку должны отвечать профессионалы из плоти и крови. Да, код может генерироваться ИИ, но фильтровать его всё равно поручено специалистам. Доминирование OpenAI на рынке ИИ подходит к концу стараниями Google и Anthropic
30.11.2025 [19:06],
Владимир Мироненко
Спустя три года с момента запуска популярного ИИ-чат-бота ChatGPT стартап OpenAI, чья рыночная стоимость оценивается в $500 млрд, столкнулся со значительными сложностями в борьбе за доминирование на ИИ-рынке, пишет The Financial Times. Ранее лидировавший со значительным отрывом от конкурентов стартап OpenAI оказался под значительным давлением со стороны Google и Anthropic, укрепивших свои позиции в последнее время.
Источник изображения: Growtika/unsplash.com На прошлой неделе Google выпустила большую языковую модель Gemini 3, которая, как утверждается, превзошла OpenAI GPT-5 по нескольким ключевым показателям и ИИ-модели других конкурентов, и достигла высоких результатов в обучении моделей, каких OpenAI не удавалось получить в последние месяцы. Ещё до этого глава OpenAI Сэм Альтман предупредил в служебной записке сотрудников, что компании «нужно будет сохранять концентрацию в условиях краткосрочного конкурентного давления… Ожидается, что ситуация на рынке будет непростой». Год назад многие сомневались в возможности Google сократить колоссальное отставание в сфере ИИ от OpenAI. Но в начале этого года, после презентации серии обновлений на конференции разработчиков Google I/O 2025 в мае и благодаря получившему высокую популярность инструменту для редактирования фотографий Nano Banana AI, наступил перелом. Ежемесячное число пользователей мобильного приложения Gemini выросло до 650 млн по сравнению с примерно 400 млн в мае. Вслед за этим начался резкий рост акций Alphabet, и рыночная капитализация холдинга приблизилась к $4 трлн на фоне уверенности Уолл-стрит в том, что Google сможет объединить свои доминирующие позиции в поиске, облачной инфраструктуре и ПО для смартфонов, чтобы запустить новые возможности в сфере ИИ. Корай Кавукчуоглу (Koray Kavukcuoglu), главный технический директор DeepMind, сообщил Financial Times, что группа крупных технологических компаний «значительно повысила показатели», обучая свои ИИ-модели на кастомных чипах от Google. «Возможность взаимодействовать с потребителями, клиентами и компаниями в таком масштабе — это то, что мы действительно можем сделать благодаря нашему комплексному интегрированному подходу», — отметил он. По его словам, использование собственных чипов позволило Google обучить Gemini 3, не полагаясь на дорогостоящие решения Nvidia, на которые опирается большинство компаний в сфере ИИ. Некоторые эксперты считают, что OpenAI переоценила свои возможности в погоне за расширением деятельности любой ценой. Стартап пообещал потратить $1,4 трлн в течение следующих восьми лет на вычислительные мощности, заключив крупные сделки с Nvidia, Oracle, AMD и Broadcom. Эта сумма гораздо превышает нынешнюю выручку OpenAI, и его партнёрам придётся прибегнуть к займам для финансирования совместных проектов. «Это очень, очень рискованная ставка для любой компании», — заявила Сара Майерс Уэст (Sarah Myers West), соисполнительный директор некоммерческой организации AI Now Institute. Сейчас для OpenAI главный вопрос заключается в том, чтобы найти достаточно крупный источник дохода для поддержания этих инвестиций. Увеличить доходы от рекламы с помощью Sora, о чём говорил Альтман, будет непросто, поскольку на этом рынке уже работают такие крупные игроки, как Meta✴✴ и Alphabet. К тому же стартап только начинает интегрировать функции рекламы и покупок в свой чат-бот. Чат-бот Claude от Anthropic не столь популярен, как ChatGPT среди потребителей, но, как сообщает The Financial Times, давняя ориентация на безопасность ИИ помогла компании создать более надёжный инструмент для корпоративных клиентов, а его средства для программирования считаются лучшими в своём классе. С более чем 800 млн еженедельных пользователей OpenAI по-прежнему доминирует по общему использованию чат-ботов, но теперь пользователи проводят больше времени в чате с Gemini, чем с ChatGPT, сообщает аналитическая компания Similarweb. Вместе с тем, по данным Sensor Tower, ChatGPT сохраняет лидирующие позиции среди ИИ-приложений. ИИ-модель Alibaba Qwen3-VL способна уловить почти все детали двухчасового видео, лишь раз его «просмотрев»
30.11.2025 [18:32],
Николай Хижняк
Спустя несколько месяцев после запуска Qwen3-VL компания Alibaba опубликовала подробный технический отчёт об открытой мультимодальной модели. Данные показывают, что система превосходно справляется с математическими задачами, связанными с изображениями, и может анализировать многочасовые видеоматериалы.
Источник изображений: Alibaba Система справляется с большими объёмами данных, обрабатывая двухчасовые видео или сотни страниц документов в контекстном окне из 256 тыс. токенов. В тестах «иголка в стоге сена» флагманская модель с 235 млрд параметров обнаруживала отдельные кадры в 30-минутных видео со 100-процентной точностью. Даже в двухчасовых видео, содержащих около миллиона токенов, точность сохранялась на уровне 99,5 %. Тест основан на вставке семантически важного кадра-«иглы» в случайные места длинных видео, которые система затем должна найти и проанализировать.
Тест «иголка в стоге сена» измеряет способность модели находить определенные кадры в длинных видеороликах В опубликованных бенчмарках модель Qwen3-VL-235B-A22B часто превосходит Gemini 2.5 Pro, OpenAI GPT-5 и Claude Opus 4.1, даже когда конкуренты используют функции логического мышления или требуют больших затрат на мышление. Модель доминирует в задачах с визуальным математическим анализом, набирая 85,8 % в MathVista по сравнению с 81,3 % у GPT-5. В MathVision она лидирует с 74,6 %, опережая Gemini 2.5 Pro (73,3%) и GPT-5 (65,8%). Модель также демонстрирует широкий диапазон результатов в специализированных бенчмарках. Она набрала 96,5 % в тесте на понимание документов DocVQA и 875 баллов в OCRBench, поддерживая 39 языков — почти в четыре раза больше, чем её предшественник.
Qwen3-VL достигает точности более 70 процентов при выполнении задач OCR на 32 из 39 поддерживаемых языков Alibaba утверждает, что модель также демонстрирует новые возможности в задачах графического интерфейса. Точность Qwen3-VL-32B в ScreenSpot Pro, тестирующем навигацию в графических пользовательских интерфейсах, составила 61,8 %. В AndroidWorld, где система должна самостоятельно управлять приложениями Android, Qwen3-VL-32B показал результат 63,7 %. Модель также обрабатывает сложные многостраничные PDF-документы. В MMLongBench-Doc она показала результат 56,2 % при анализе длинных документов. В бенчмарке CharXiv для научных диаграмм она достигла 90,5 % при выполнении задач описания и 66,2 % при выполнении сложных логических задач. Однако не во всех случаях Qwen3-VL оказалась лучше конкурентов. В сложном тесте MMMU-Pro модель набрала 69,3 %, уступив GPT-5 с результатом 78,4 %. Коммерческие конкуренты также обычно лидируют в тестах качества видео. Данные свидетельствуют, что Qwen3-VL специализируется на визуальных математических задачах и документах, но всё ещё отстаёт в области общих логических рассуждений. В техническом отчёте описаны три основных архитектурных обновления, реализованных в Qwen3-VL. Во-первых, «interleaved MRoPE» заменяет предыдущий метод позиционного встраивания. Вместо группировки математических представлений по размерности (время, горизонталь, вертикаль), новый подход равномерно распределяет их по всем доступным математическим областям. Это изменение направлено на повышение производительности при работе с длинными видео. Во-вторых, технология DeepStack позволяет модели получать доступ к промежуточным результатам видеокодера, а не только к конечному результату. Это предоставляет системе доступ к визуальной информации с разной степенью детализации. В-третьих, система временных меток на основе текста заменяет сложный метод T-RoPE, используемый в Qwen2.5-VL. Вместо того, чтобы присваивать математическую временную позицию каждому видеокадру, система теперь вставляет простые текстовые маркеры, например, «<3,8 секунды>», непосредственно во входные данные. Это упрощает процесс и улучшает понимание моделью задач, связанных с анализом видео с временными рамками.
Qwen3-VL объединяет видеокодер и языковую модель для одновременной обработки текста, изображений и видео. DeepStack использует визуальную информацию с разных уровней обработки Alibaba обучала модель в четыре этапа на базе 10 тыс. графических процессоров. После обучения связыванию изображений и текста система прошла полное мультимодальное обучение примерно на триллионе токенов. Источниками данных были веб-скрапы, 3 млн PDF-файлов из Common Crawl и более 60 млн STEM-задач. На последующих этапах команда постепенно расширяла контекстное окно с 8000 до 32 000 и, наконец, до 262 000 токенов. Варианты Thinking прошли специальное обучение Chain-of-thought training, что позволило им генерировать промежуточные шаги рассуждения перед предоставлением окончательного ответа для достижения лучших результатов при решении сложных задач. Все модели Qwen3-VL, выпущенные с сентября, доступны по лицензии Apache 2.0 с открытыми весами на Hugging Face. Линейка включает плотные варианты с параметрами от 2B до 32B, а также модели со смесью экспертов 30B-A3B и массивные 235B-A22B. Хотя такие функции, как извлечение кадров из длинных видео, не являются новыми (в начале 2024 года Google Gemini 1.5 Pro уже реализовал эту функцию), Qwen3-VL предлагает конкурентоспособную производительность. Поскольку предыдущая модель Qwen2.5-VL уже широко применялась в исследованиях, новая модель, вероятно, станет стимулом для дальнейшей разработки ПО с открытым исходным кодом. Инвесторы не спешат пугаться ИИ-пузыря — деньги в стартапы льются как прежде
30.11.2025 [08:46],
Алексей Разин
Зародившийся в сознании некоторых инвесторов скепсис по поводу неизменности роста котировок акций компаний, причастных к развитию инфраструктуры искусственного интеллекта, уже вызвал корректировку на бирже и заставил основателя Nvidia оправдываться. Между тем, в сегменте стартапов пессимизмом пока и не пахнет, и их основатели продолжают грести деньги лопатой.
Источник изображения: Freepik, jcomp Об этом сообщает Financial Times по итогам консультаций с рядом американских венчурных инвесторов, которые вкладывают средства в молодые компании на начальных этапах в надежде заработать деньги на росте их капитализации в будущем. Феномен заключается в том, что на рынке труда сейчас не так много эффективных специалистов в сфере искусственного интеллекта, поэтому получившие даже небольшой опыт разработчики нередко уходят от своих работодателей, чтобы основать собственные стартапы. Инвесторы при этом охотно доверяют им крупные суммы, не особо задумываясь о последствиях. По сути, наиболее ярким примером такого дробления могут служить истории появления стартапов Thinking Machines Lab и Safe Superintelligence, основанные выходцами из OpenAI Мирой Мурати (Mira Murati) и Ильёй Суцкевером. Капитализация их стартапов в пределах первого года существования выросла до десятков миллиардов долларов США. Первый из них, по некоторым оценкам, сейчас стоит $50 млрд. Основатели стартапов легко привлекают сотни миллионов долларов, не располагая особой историей или репутацией, при этом венчурные инвесторы выстраиваются в очереди, чтобы отдать им деньги. Некоторые инвесторы предполагают, что среди самых крупных ИИ-стартапов в США в ближайшие два года с высокой вероятностью найдётся тот, чья капитализация в указанный период достигнет $1 трлн даже до выхода на IPO. Основателей стартапов вероятность банкротства не очень пугает. Если что-то в их бизнесе пойдёт не так, крупные корпорации наверняка купят его по хорошей цене, поскольку в сфере ИИ сейчас наблюдается дефицит кадров, а стартапы как раз располагают некоторым человеческим капиталом. Ускорители вычислений Baidu имеют все шансы стать хитом китайского рынка
30.11.2025 [08:19],
Алексей Разин
Китайский интернет-гигант Baidu в уходящем месяце представил собственные ускорители M100 и M300 для работы в инфраструктуре искусственного интеллекта. Ориентированный на инференс M100 будет доступен в начале следующего года, а более универсальный M300 с 2027 года позволит китайским компаниям хотя бы частично решить проблему дефицита вычислительных ресурсов для обучения больших языковых моделей.
Источник изображения: Baidu, TechPowerUp Опрошенные CNBC аналитики сходятся во мнении, что при правильной организации производства и маркетинга ускорители Baidu помогут китайским разработчикам решить сразу две проблемы. Во-первых, они снизят зависимость от американских ускорителей в условиях санкций. Во-вторых, они позволят удовлетворить требования китайских властей по переходу на использование чипов локальной разработки. Инвесторы на этом фоне начали смотреть на акции Baidu с возросшим оптимизмом. Они убеждены, что появление в арсенале Baidu собственных ускорителей не только поможет развитию бизнеса этой компании, но и привлечёт к ним прочих участников китайского рынка. Один из крупнейших операторов мобильной связи в КНР, компания China Mobile, уже начал закупать ускорители Kunlunxin у Baidu. Последняя в этом смысле становится серьёзным конкурентом для Huawei Technologies, которая с трудом наращивает объёмы выпуска собственных чипов в условиях санкций. Появление ещё одного конкурентоспособного поставщика на рынке Китая пойдёт на пользу местному рынку искусственного интеллекта. По прогнозам JPMorgan, в следующем году Baidu сможет нарастить выручку от реализации своих чипов в шесть раз до $1,1 млрд. Капитализация профильного подразделения компании при этом достигнет $28 млрд. Китайские программные гиганты испытывают нехватку вычислительных ресурсов. Руководство Tencent в этом месяце было вынуждено признаться, что по итогам 2025 года капитальные затраты компании окажутся ниже ожидаемых, поскольку ей банально не хватает ИИ-чипов для введения в строй новых вычислительных мощностей. Руководство Alibaba недавно также призналось, что не успевает предлагать клиентам новые облачные мощности в достаточном для удовлетворения спроса объёме. Если Baidu сможет ритмично выпускать новые поколения ИИ-чипов, то на китайском рынке эта продукция окажется в числе фаворитов, по мнению аналитиков The Futurum Group. |
|
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |