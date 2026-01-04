В Сети предостаточно рейтингов ИИ-сервисов и приложений, отбиравшихся по самым разным критериям, однако практически все без исключения они открываются перечнем чат-ботов — среди которых на первом месте заслуженно располагается ChatGPT разработки OpenAI: 917 млн загрузок на смартфоны за 2025 год — именно как приложения, без учёта обращений через браузеры; 273 млн (только смартфонных) и примерно 800 млн активных пользователей всего ежемесячно, что впятеро больше, чем у следующего за ним ИИ-сервиса (а это, кстати, Doubao, созданный китайской ByteDance). Объясняется всё просто: сегодня по-настоящему большие языковые модели (БЯМ), доступные через облачные ИИ-боты, наиболее универсальны в силу своей мультимодальности и доступа к едва ли не безграничным аппаратным ресурсам гиперскейлерских дата-центров. Такие модели способны к «рассуждениям», готовы выдавать аргументированные ответы со ссылками на источники, рисовать статичные картинки, писать музыку, создавать видеоролики и т. д. Более специализированные же приложения — и онлайновые, и тем более предназначенные для исполнения на локальных ПК — часто опираются на нейросети послабее, и хотя за счёт удачного подбора тренировочных дата-сетов порой демонстрируют неплохие результаты, в целом с продуктами OpenAI, Google или DeepSeek им невероятно сложно соперничать.

Так что и в нашем, довольно узком, рейтинге универсальные модели по объективным причинам будут доминировать. И начнём мы с визуальных продуктов ИИ-генерации — в которых превосходство облачных БЯМ проявляется (сейчас будет каламбур, внимание) особенно зримо. Точнее, так: сами по себе закрытые (исполняемые исключительно в облаке, без возможности скачать и запустить их локально) рисовалки видео и картинок не обязательно сверхмасштабны: у Sora, судя по косвенным данным, то ли 20 млрд параметров, то ли вообще не более 3 млрд, у Nano Banana — 80 млрд всего, из которых в базовой конфигурации активны 13 млрд. То самое превосходство им обеспечивают чрезвычайно мощные — по сравнению с локальными — средства преобразования пользовательских подсказок в цепочки токенов. Как вам, скажем, контекстное окно в 32 768 токенов у основанного на Gemini 2.5 Flash кодировщика Nano Banana — по сравнению с 77 токенами у CLIP или даже с 512 у T5? Кодировщики эти, построенные на базе действительно крупных БЯМ, допускают не просто «рассуждения» (reasoning) в процессе обработки запроса, только ведение итеративного конкретизирующего диалога с оператором. Моделям попроще соперничать с ними решительно не с руки.

Одним из лидирующих ИИ-генераторов видеороликов — по текстовой подсказке, по картинке-затравке, по комбинации этих исходников — остаётся созданная OpenAI модель Sora, с осени 2025 г. — уже вторая её версия. Генератор этот с середины года доступен бесплатно в приложении Bing (для авторизации требуется учётная запись Microsoft) и в фирменном приложении для iOS, а привлекателен он как возможностью сделать себя самого героем ролика, так и неплохим «пониманием» физики реального мира. Скажем, если видео создаётся на основе картинки, на которой баскетболист завис в прыжке с мячом на кончиках пальцев, то мяч в ролике может попасть точно в корзину, может отскочить от её края или от щита, но вероятность того, что он пройдёт прямо сквозь кольцо (как это частенько изображали ИИ-видеогенераторы прежде) практически нулевая. И с движениями людей, и с эмоциями Sora 2 справляется на отлично: недаром сразу после её анонса в Сети завирусился ролик с Сэмом Альтманом (Sam Altman), которого хватают при попытке вынести, не оплатив, видеокарту из магазина. За пять суток приложение Sora скачали один миллион раз, — более того, его мошеннические клоны просто-таки заполонили App Store, что тоже свидетельствует об успешности модели. Дошло до того, что именно к OpenAI обратились японские власти с призывом пожёстче соблюдать авторские права творцов из Страны восходящего солнца на персонажей аниме и манги, — уж больно неотличимыми от оригиналов те выходили у ИИ-генератора. Появившееся в ноябре лишь в нескольких странах приложение Sora для Android скачали полмиллиона раз за сутки, и в итоге OpenAI всё-таки вынуждена была заметно ограничить количество доступных генераций: слишком высокой оказалась нагрузка на серверы.

Аналогичный генератор видео от другого ИИ-гиганта, Google, под названием Veo, в феврале привлёк к себе внимание тем, что стал доступен прямо в YouTube для создания роликов по текстовому описанию. В апреле к Veo 2 получили доступ платные пользователи Google Gemini, а в мае эпоха «великих немых» в отрасли ИИ-генерации по сути завершилась: новая модель, Veo 3, получила функциональность одновременного с созданием видеоряда порождения аудиодорожки для него. Тогда же вышли приложения с поддержкой Veo 3 для Android и iOS. Поскольку для обучения мультимедийной модели вовсю использовался загруженный на YouTube контент (и Google никогда не скрывала, что использует ролики пользователей для тренировки своих ИИ), качество сопряжения аудио и видео у этой модели особенно высокое. В этом теперь могут убедиться пользователи Gemini, которым благодаря Veo 3 доступно создание 8-секундных роликов с озвучкой. В сентябре модель научили креативить вертикальные видеоролики для соцсетей, а в октябре вышла Veo 3.1 — с ещё более реалистичными изображениями и улучшенным звуком. Ролик, который в виде GIF-файла иллюстрирует эту главку, как раз создан с применением Google Veo 3.1 и озвучен по подсказке «Christmas carol is heard», — что за колядка у ИИ получилась, можно услышать, запустив 5-Мбайт видео по этой ссылке.

⇡#ИИ-живописцы: Nano Banana, GPT Image

За 2025 год генеративные модели стали куда совершеннее прежнего по части отрисовки статических картинок по текстовым подсказкам, T2I (text-to-image). Особенно хорошо справляются с этим большие мультимодальные модели (прямой доступ к которым, в ряде случаев даже без дополнительной платы, есть у пользователей диалоговых ИИ-ботов высшего разряда), поскольку исходный запрос сперва пропускается через саму эту БЯМ — которая не просто преобразует его в цепочку токенов, но выстраивает логические связи между отдельными объектами. Так, представленную Google в августе — как расширение набора инструментов чат-бота Gemini — модель Nano Banana моментально окрестили «ИИ-фотошопом», поскольку по сути это не какая-то отдельная «нейрорисовалка», а полноценная БЯМ Gemini 2.5 Flash AI, располагающая немалым массивом сведений о реальном мире и о взаимодействии его элементов. Nano Banana помогает превращать пользовательские фото в мемы или бережно редактировать изображения (ну вот моргнул человек не вовремя, а переснять уже невозможно, — модель поможет раскрыть глаза, не тронув ни единый иной элемент снимка). В ноябре появилась усовершенствованная версия, Nano Banana Pro, — она нативно работает с расширениями до 4K (т. е. никакого апскейла не потребуется, чтобы создать обои для современного монитора или смартфона), сводит до 14 изображений отдельных предметов и фотоснимки до 5 человек в единый композиционно выдержанный кадр; меняет точку фокусировки, время дня и ночи, время года на готовом снимке и т. д., — в общем, проделывает такие фокусы, которые моделям с более скромными аппаратными требованиями (включая нашу свежую фаворитку в зачёте локальной T2I-генерации, Z-Image Turbo, увы) не снились.

Уже под самый конец года OpenAI выкатила обновление своей и без того вполне удачной T2I-модели — GPT Image 1.5, базирующейся, ясное дело, на наиболее свежей версии основной БЯМ разработчика — GPT-5.2. В числе достоинств новинки упомянуты прецизионное редактирование (уже приводившийся пример с закрытыми глазами: модели прежних поколений тоже способны были «разжмурить» человека, но при этом малопредсказуемым образом искажали, пусть и не сильно, исходную картинку, что крайне затрудняло ИИ-модификацию образов), улучшенная обработка текста и более скрупулёзное следование тексту подсказки. Да, результат нельзя назвать идеальным: GPT Image 1.5 с некоторым трудом генерирует многофигурные композиции с существенно различными лицами и плоховато справляется с текстами на отличных от английского языках. Но в целом она действительно хороша: скажем, чтобы добиться сопоставимой точности при редактировании, локальным моделям приходится применять немалые хитрости вроде ControlNet или же загружать специально натренированные на изменение (а не создание) картинок чекпойнты, — здесь же практически всё предлагается в одном.

Ещё одна T2I-новинка декабря 2025 года — модель Seedream 4.5 (точнее, Doubao-Seedream-4.5) разработки китайской ByteDance. Как и другие генераторы картинок с опорой на крупные БЯМ, она доступна и на материнском сайте разработчика, и в специализированном приложении, и на ряде онлайновых площадок, таких как известный нашим читателям портал Civitai.com. Seedream 4.5 тоже очень достойно оперирует множеством предложенных исходных картинок, организуя их композиционное единство в разрешениях вплоть до 4К; уверенно следует пространным, детализированным подсказкам и хорошо справляется с мелкой детализацией лиц (что особенно важно, если изображение демонстрирует оживлённую улицу, например, — часто AI-slop выдаёт себя как раз в смазанных, блиноподобных физиономиях персонажей заднего плана). И генерация постеров/плакатов/рекламных фото с подписями этой модели тоже удаётся неплохо, хотя размер её (что в целом традиционно для китаянок) меньше, чем у GPT-5.2 или Grok 4.1. Зато, в отличие от многих других T2I-генераторов родом из КНР, вроде уже упомянутой Z-Image Turbo, Seedream 4.5 не предлагают для скачивания и локального исполнения, — только в облаке.

Строго говоря, сами объекты для изучения в этой категории — чат-боты, базирующиеся на подлинно крупномасштабных БЯМ, — определены весьма расплывчато. Хотя интерфейсы их веб-сайтов или смартфонных приложений меняются со временем незначительно, сами модели, используемые для обработки принятых через бот запросов пользователя, стремительно эволюционируют: за отчётный год успевают сменить одно другое несколько поколений. Так, в январе 2025 г. OpenAI представила 03-mini, свою новейшую на тот момент «рассуждающую» модель, и даровала пользователям возможность выбирать манеру общения бота с ними — для начала предложив профили «Болтунишка» (Chatty), «Подпевала» (Encouraging) и «Зумер» (Gen Z). Вроде бы косметическое усовершенствование, но то, как именно идёт разговор с ИИ, бесспорно влияет на его восприятие, — так что неопределённости в плане оценки сервиса это тоже добавило. В марте для разработчиков открыли доступ к самой дорогой (в смысле платы за доступ к ней) модели o1-pro, а пользователям ChatGPT предоставили возможность генерировать изображения прямо в чате — силами GPT-4o. Благодаря этому тогда же, кстати, завирусились до сих пор нередко попадающиеся в соцсетях картинки в узнаваемой аниме-стилистике Studio Ghibli. Чуть позже анонсировали GPT-4.1, o3 и o4-mini, а более ранние модели постепенно убирали из открытого доступа. В июне появились новые возможности для бизнес-пользователей: интеграция с облачными сервисами, записи проводимых онлайн встреч с автоматическим транскрибированием и т. п. Была запущена очередная передовая «рассуждающая» модель o3-pro, а в июле набор доступных в ChatGPT инструментов пополнил Agent — ИИ для выполнения от имени пользователя достаточно сложных заданий (вплоть до подбора продуктов для предложенных рецептов в онлайн-магазинах, создания аналитических презентаций и даже прохождения теста CAPTCHA) на виртуальном ПК. Появился в ChatGPT и «учебный режим» — Study Mode, — призванный развивать у пользователей (учащихся главным образом) критическое мышление и способность самостоятельно додумываться до верных ответов.

Август ознаменовался релизом модели GPT-5 — которую сперва приняли архикритично, скоренько взломали, зато корпоративным клиентам она пришлась по душе. В сентябре была предложена версия с «динамическим мышлением» для агентного программирования — GPT-5-Codex, а в США появился инструмент для онлайн-покупок прямо из ChatGPT — Instant Checkout. Были анонсированы персонифицированный агентный помощник Pulse и родительский контроль. В октябре сторонним разработчикам (Booking.com, Spotify, Coursera и др.) предоставили возможность развивать свои мини-приложения прямо внутри ChatGPT; в ноябре запустили GPT-5.1 — с «усовершенствованными рассуждениями» и «более приятную в общении». В ряде регионов мира начали тестировать групповые чаты в ChatGPT, внедрили голосовой режим коммуникации в основное окно, запустили ИИ-помощник для сезонного шопинга. Наконец, в декабре выкатили самую свежую модель GPT-5.2 (и под самый конец года даже успели перезапустить её, усилив меры защиты подростков). Кроме того, в свет вышла обновлённая модель для генерации изображений GPT Image 1.5, а новые настройки чата дают возможность пользователю на свой вкус выбирать «теплоту тона» ИИ-собеседника, уровень его энтузиазма, контролировать применение им эмодзи и особенности форматирования выдаваемого текста.

Не стоит, таким образом, удивляться, что практически во всех рейтингах ИИ-сервисов и приложений — и наш тут исключением не станет — именно ChatGPT отведена лидирующая позиция. Да, с коммерческой точки зрения проект по-прежнему провальный; да, планируемые на 2026-й и далее расходы чудовищно несуразны, но по крайней мере объёмам проделанной работы и непрерывно фонтанирующим нововведениям должное отдать следует.

Выбранное компанией xAI, очередным детищем Илона Маска (Elon Musk), для своего умного бота название — серьёзная заявка на (потенциальную) безграничность его возможностей. В 1961 г. слово «грок» (grok) появилось в научно-фантастическом романе Роберта Хайнлайна (Robert Anson Heinlein) «Чужак в чужой стране» (Stranger in a Strange Land) как заимствование из марсианского, причём введено оно было без чёткого определения в самом начале книги, а более или менее внятная дефиниция его появилась лишь ближе к финалу. По сути, всё повествование и посвящено раскрытию этого крайне многогранного термина: «Грок означает понимать настолько глубоко, что наблюдатель становится частью наблюдаемого, — сливаться, смешиваться, переплетаться, терять идентичность в групповом опыте». В Оксфордский словарь английского языка grok вошло с пояснением «понимать интуитивно, сопереживать», даже «испытывать удовольствие»; словом, чат-бот Grok всерьёз претендует на звание глашатая чистой истины для взыскующего той человечества. Не случайно в ходе февральского анонса модели Grok 3 сам Маск представлял её как «самый умный ИИ на Земле» и «максимально правдивый ИИ», причём осознанно сделанный бесплатным для всех, невзирая ни на какие материальные преграды, — «пока наши серверы не расплавятся».

И действительно, правду-матку Grok 3 принялся увлечённо резать с самого момента запуска: вызывающе флиртовал с пользователями, отпускал непристойные комментарии, не заморачивался толерантными обиняками при описании чувствительных тем и т. д. Постепенно расширялся его арсенал: появилась встроенная среда Studio для работы с документами и программным кодом, пользователи получили возможность диктовать боту, что ему запоминать в ходе общения с ними, а что забывать, было добавлено распознавание объектов реального мира. Правда, отсутствие «поручней безопасности» (guardrails), при помощи которых другие аналогичные модели фильтруют контент, время от времени играло с ботом злые шутки: так, в мае его уличили в сомнениях по поводу общепринятой точки зрения на Холокост, — Маску пришлось даже оправдываться, ссылаясь на вкравшиеся в код «программные ошибки». В июле был анонсирован Grok 4 — со значительно усиленными контурами обучения с подкреплением, мультимодальными возможностями и доступом в режиме реального времени к контролируемым империей Маска платформам, включая X (в девичестве Twitter), Tesla, SpaceX и даже Starlink (и, разумеется, для обучения сторонних ИИ контент с этих платформ запретили использовать).

При всех достоинствах Grok этот амбициозный проект тоже нельзя назвать идеальным в плане бизнес-модели и общей организации: он приносит xAI ежемесячный убыток примерно в 1 млрд долл. США; сама xAI полагается для генерации необходимой энергии на газовые турбины, что крайне не по сердцу экоактивистам; после каждого более или менее крупного обновления находятся уязвлённые «ещё большей неполиткорректностью» ИИ-собеседника. Да и в целом, кстати, при ответах на неоднозначные вопросы Grok склонен придерживаться того же мнения, что и Илон Маск, а не взвешенно-отстранённо излагать все существующие точки зрения («МАСКимально правдивый, а не МАКСимально», как иронизируют в Сети). Судя по тому, что в числе анимированных ИИ-компаньонов для коммуникации с Grok появилась весьма избирательно одетая анимешная девушка, а рисовальщик картинок Grok Imagine с готовностью принимает пикантные подсказки и справно их отрабатывает, владелец xAI и этой субкультуре не чужд. Правда, отдавая себе отчёт в ограниченной приемлемости такого подхода, Маск пообещал разработать специальную «детскую» версию Grok. Увлечённость «максимальной правдивостью», кстати, вышла xAI боком: в августе компания лишилась крупного госконтракта как раз из-за того, что властям США не по душе пришлись слишком уж экстремистские высказывания Grok (правда, по электронному письму из Белого дома её скоренько вернули в список одобренных).

Под конец года xAI явно вошла в полосу турбулентности: обнаружилась утечка приватных диалогов с пользователями; компанию покинул финансовый директор, не проработав и полугода; бывшего сотрудника обвинили в краже секретов для OpenAI; мошенники подучили Grok распространять вредоносные ссылки; на фоне увольнения полутысячи сотрудников разом в коллективе сложилась «душная атмосфера» из-за засилья в руководстве любимчиков Маска; сам Grok на какое-то время возомнил себя всемогущим и т. д. Тем не менее вышедший в ноябре Grok 4.1 лидирует в независимых тестах LMArena, а проект «Грокипедия» проявил себя довольно-таки неплохо, хотя и не обошёлся без копипаста. В общем, для пространных бесед с глубоким погружением в материал, не обременённых избыточной толерантностью, лучшего ИИ-бота сегодня, пожалуй, не сыскать.

Искусственный интеллект, как говорят, превосходит по значимости освоение космического пространства с точки зрения революционности воплощённых в нём технологий. Поспорить с этим, конечно, можно (одно дело — сконструировать реактивный двигатель, способный преодолеть силу земного тяготения; другое — научить компьютер эффективно перемножать матрицы), но при нынешних темпах внедрения ИИ бесспорно продолжит день ото дня затрагивать всё более обширные сферы хозяйства и повседневной жизни людей. Так что суверенные БЯМ — дело нужное, хорошее, и отрадно, что в России их развивается сраЗу несколько. Мы вновь, как и в прошлогоднем обзоре схожей тематики, обращаем внимание на созданный специалистами «Сбера» GigaChat — его как раз весьма активно привлекают для интеллектуализации, если можно так выразиться, самых разнообразных проектов. Например, «Лаборатория Касперского» интегрировала GigaChat в свою систему KUMA, предназначенную для мониторинга и анализа инцидентов ИБ, а легенда Рунета, полузаброшенный какое-то время назад «Рамблер», при поддержке этой БЯМ превратился в современный модный ИИ-портал. GigaChat тоже деятельно развивался: в марте 2025 г. обновился до версии 2.0 в нескольких вариантах (включая наиболее передовые MAX и Pro; кстати, почему не «Большак» и «Дока», например, — суверенитет же?), а в июне было объявлено об интеграции GigaChat в рабочее окружение одной из отечественных ОС, Astra Linux.

Тогда же нейросеть научили проводить профессиональный многоступенчатый анализ информации, включая поиск по онлайновым источникам, а в июле GigaChat стал доступен даже на парковке в национальном мессенджере MAX (ещё на этапе внутренних испытаний, до официального релиза последнего). Свой ИИ «Сбер» интегрирует, разумеется, и в собственную экосистему умного дома, и в умную компактную колонку SberBoom Micro, и в более крупный гаджет SberBox Max. В результате к исходу октября, когда трафик ИИ-сервисов в России с начала года вырос шестикратно, GigaChat вышел на третье место по популярности с 7,3% пользователей (после ChatGPT с 39,9% и DeepSeek с 27,8 %, тогда как за аналогичный период 2024-го он добился всего лишь 6-й позиции с 3,3% пользователей — его в то время обходил даже YandexGPT (ныне «Алиса AI») с 7,1%. Аудитория ИИ «Сбера», по оценке самого разработчика, выросла за год на порядок, а ежемесячное число уникальных пользователей достигает 19 млн человек. И невооружённым глазом прогресс заметен: если в конце 2024-го GigaChat тушевался в ответ на наш невинный вопрос «Чьим был Крым в 1725 году?», отнекиваясь тем, что он-де «не обладает собственным мнением и не транслирует мнение своих разработчиков» (позвольте, а тренировочную базу данных ему кто собирал и guardrails кто программировал, — Пушкин?), то теперь уже со ссылками на источники констатирует, что де-факто в тот год полуостровом управляли местные ханы, но формально он находился под контролем Оттоманской империи. А вот на вопрос о более актуальном его статусе БЯМ и в 2025-м по-прежнему отвечать не готова. Штош; возможно, однажды наступит-таки день, когда программный продукт компании с государственным участием (50% + 1 одна акция принадлежат ФНБ) решится начать вслух признавать границы, установленные Конституцией того же самого государства.

В принципе, формат «лучших ИИ-сервисов и приложений» подразумевает ещё целую прорву категорий: помощники для организации встреч, создатели песен и музыки, исследовательские инструменты, подспорье в написании текстов и создании презентаций, средства графического дизайна, автоматизированные секретари для ведения почтовой корреспонденции, составители распорядков дня, ИИ-маркетологи и т. д. Но, право, мощь передовых мультимодальных БЯМ сегодня настолько велика — и, судя по тому, что их разработчики уже дерутся между собой за (весьма ограниченный) ресурс доступных на рынке ускорителей и оперативной памяти, — более специализированным проектам с узкой аудиторией и скромными инвестициями в 2026 году тем более ничего хорошего не светит. Ставить придётся на лидеров — а уж те позаботятся (благо конкуренция между ними развёртывается нешуточная), чтобы пользователи, какие бы потребности в ИИ-инструментах у них ни возникали, обделёнными себя не чувствовали.