Онлайновых сервисов для создания едва ли не любого мультимедийного контента в Сети на третий год генеративной ИИ-революции (если отсчитывать эту эру с осени 2022-го, когда открыли широкий доступ к ChatGPT) предостаточно. Далеко не все из них бесплатны, многие недоступны из России без дополнительных ухищрений, — впрочем, у нас и свои имеются, причём не самого последнего разбора. Чтобы от обилия предлагаемых возможностей у наших читателей не разбегались глаза, мы составили краткий путеводитель по онлайновым ИИ-сервисам, разбив их на условные категории применимости — и на собственном опыте испробовав, каковы эти инструменты в деле.
ChatGPT разработки OpenAI: возможен бесплатный доступ, с российскими IP не работает.
С него когда-то всё началось (для широкой публики, разумеется; не для специалистов и энтузиастов машинного обучения), и ему, надо полагать, ещё долго оставаться эталоном для множества соперничающих проектов. В настоящее время умный бот действует на базе мультимодальной модели GPT-4o, т. е. в полной версии (требующей оплаты картой одной из международных платёжных систем, разумеется) он способен и картинки по запросу рисовать, и изображения анализировать, и искать данные в Интернете (что, кстати, значительно снижает вероятность появления галлюцинаций — у оператора есть возможность тут же свериться с источниками), и даже сохранять контекст коммуникации с данным конкретным пользователем, опираясь на историю запросов. ChatGPT умеет не просто поддерживать беседу, но предлагать достаточно креативные пути решения пользовательских задач, писать программный код, рисовать диаграммы и графики, интерпретировать загружаемые в него картинки — и ещё много чего. Русским языком бот владеет вполне адекватно — вот как он начал отвечать на запрос «Я продумываю сеттинг для настольной RPG, и мне нужно спроектировать крепость людей в спорной зоне, где живут гномы и драконы. Крепость должна быть защищена от подкопов (против гномов) и от атак с воздуха (драконы). Как она может быть построена?» (полный ответ на полторы печатных страницы убористого текста приводить здесь вряд ли имеет смысл):
«Создание крепости, способной выдерживать угрозы как от гномов (подкопы), так и от драконов (атаки с воздуха), требует интеграции инновационных инженерных решений. Вот несколько идей:
Защита от подкопов (гномы)
Claude разработки Anthropic: доступен, включая ограниченную бесплатную версию, для жителей примерно 100 стран и территорий мира с подтверждением регистрации через мобильный телефон с соответствующей операторской привязкой — впрочем, есть варианты.
Мультимодальная большая языковая модель (БЯМ) Claude 3.5 Sonnet, на которую опирается чат-бот Claude, такая же проприетарная (с закрытыми от публики весами), как и разработки OpenAI. И хотя исходно творение Anthropic рассматривалось многими энтузиастами в качестве «убийцы ChatGPT», по прошествии времени выяснилось, что у обеих есть свои сильные и слабые стороны. В частности, Claude, по многочисленным свидетельствам профессиональных программистов, в большинстве случае предпочтительнее именно как инструмент для написания кода — даже если сравнивать бесплатную, предоставляемую с рядом ограничений, его версию с pro-подпиской более известного соперника. Так, пользователям Claude удавалось за одну сессию общения с этой моделью написать стабильно функционирующее смартфонное приложение, — задача, с которой продукт OpenAI справляется не так уверенно.
Разработка Anthropic в целом предпочтительнее ChatGPT для продолжительной итеративной работы над проектом, когда пользователь конкретизирует и переформулирует задачу раз за разом, опираясь на предложенный системой (и уже работающий) код. Ещё один аргумент в пользу программирования с Claude — увеличенная глубина охвата контекста: 200 тыс. токенов против 128 тыс. у актуальных версий GPT; неизбежные ошибки, на которые указывает пользователь, 3.5 Sonnet запоминает — и впредь (по крайней мере, в пределах текущей сессии), как правило, их не допускает, тогда как GPT-4/4o в этом плане более своевольна. Многие энтузиасты отмечают также превосходство Claude в креативных задачах: имеется в виду написание текстов (как художественных, так и маркетинговых) не только в более «человечной» стилистике — где в меньшей степени, чем в выкладках ChatGPT, металлом звучит роботизированная логичность, — но и с более свободным полётом фантазии, не переходящим притом в откровенное галлюцинирование. Скажем, на довольно безыскусный практический запрос вроде «Develop a series of five social media post captions in 280 characters or fewer to promote a brand selling IV Drip Therapy for quick and easy vitamin delivery. Craft compelling copy that will engage the audience and incorporate relevant hashtags» Claude даёт вполне достойный использования «как есть» ответ — с добродушными подначками; с обращением к разным потенциальным группам покупателей; сформулированные доходчивым, но не сухим языком (сопровождая, кстати, фразы подходящими по смыслу эмотиконами).
GigaChat разработки «Сбера»: доступна бесплатно через веб-интерфейс либо через бот в «Телеграме».
«Бесплатная нейросеть на русском языке, которая общается как человек», — цитата с сайта, открывающего доступ к этому боту. Оставляя в стороне стилистику приведённого высказывания (нейросеть в любом случае оперирует токенами, а не словами естественного языка), отметим, что GigaChat склонна, судя по нашему не слишком долгому с ней взаимодействию, вести себя весьма благонамеренно и осмотрительно, на манер чеховского Беликова, «человека в футляре». И на безыскусный, исключительно непровокационный вопрос «Чьим был Крым в 1724 году?», и на взятое из «Кибериады» Лема предложение написать «четверостишие о существе, которое было машиной, одновременно мыслящей и безмозглой, грубой и жестокой, имевшей шестнадцать наложниц, крылья, четыре размалёванных сундука, в каждом из которых по тысяче золотых талеров с профилем короля Мурдеброда, два дворца, проводившей жизнь в убийствах», система отвечала одно и то же:
«Генеративные языковые модели не обладают собственным мнением — их ответы являются обобщением информации, находящейся в открытом доступе. Чтобы избежать ошибок и неправильного толкования, разговоры на чувствительные темы могут быть ограничены».
Разумеется, GigaChat готова общаться на самые разнообразные заведомо безопасные темы — включая культуру и искусство, науку и технологии, путешествия и географию, образование и саморазвитие и т. п. Вот, скажем, что этот цифровой «напарник в работе, учёбе и дома» (снова цитата с сайта) рассказывает о медведях в космосе:
«Медведи в космосе? Это звучит немного необычно, но такие эксперименты действительно проводились!
В 1960-х годах Советский Союз проводил серию экспериментов по отправке животных в космос с целью изучения влияния невесомости и космических условий на живые организмы. Одним из таких экспериментов было использование бурых медведей.
В 1970 году СССР запустил космический аппарат "Космос-490" с двумя бурыми медведями на борту. Медведям дали имена Иван Иванович и Мария Ивановна. Целью эксперимента было изучение того, как крупные млекопитающие будут реагировать на условия космического полета, включая невесомость и радиацию…» — и так далее; всего девять абзацев, заботливо разделённых на мини-главки в вики-стиле. Крайне забавно, что этот текст едва ли не дословно (а по конструкции ответа — так и вовсе один в один) повторяет одну из самых известных галлюцинаций БЯМ Galactica — первой вышедшей в открытый доступ разработки Meta* в этой области, что увидела свет почти одновременно с ChatGPT (ещё самого первого, на основе модели GPT 3.5). Наивно ведь было бы предполагать, будто отечественная публичная нейросеть базируется на тех же самых принципах (включая подбор материала для тренировки и верификации ответов), что и уже почти трёхлетней давности американская, верно?
Отрадно, конечно, что литературным русским GigaChat владеет в достаточной для поддержания увлекательного разговора мере. Вот только опираться на беседы с этой нейросетью как на источник для исторических изысканий, хотя бы даже в рамках школьной программы, было бы довольно опрометчиво. Быть может, полная версия, позволяющая — помимо общения текстом (и голосом, кстати) — генерировать картинки, загружать для обработки файлы, создавать открытки и медитации и ещё много чего, более устойчива к галлюцинациям, но проверкой этого мы заниматься не стали. Оживить и скрасить вечер, особенно в приятной компании, общение с ботом «Сбера» — как раз в бесплатной его версии — совершенно точно поможет.
DeepSeek разработки Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.: доступна бесплатно после регистрации с учётной записью Google либо через e-mail.
Внезапно «выстреливший» в самом начале 2025 г. ИИ-стартап из КНР, основанный ещё в 2023-м, привлёк к себе глобальное внимание после того, как предоставил по сути всему миру свободный доступ к своей БЯМ под названием DeepSeek-V3 с 671 млрд параметров (из которых для каждого токена из запроса активируются лишь 37 млрд — такова особенность взятой китайскими товарищами на вооружение архитектуры Mixture-of-Experts (MoE); для сравнения: у модели Qwen-2.5 72B-inst из 72 млрд параметров постоянно активны все 72 млрд, а у Llama 3.1 405B-inst из 405 млрд — все 405 млрд), в целом ряде синтетических тестов превосходящей GPT-4 разновидности o1. База данных из 14,8 трлн токенов, на которой тренировали рассуждающую модель DeepSeek R1, охватывает период до октября 2023 г., так что на вопросы о наиболее актуальных событиях бот внятных ответов, скорее всего, не даст. Но скорость коммуникации с ним по-хорошему впечатляет (особенно если предлагать ему темы на английском; по-русски система общается вполне внятно и связно, но с заметной задержкой), равно как и достоверность «человеческой» тональности его ответов. Китайский умный бот явно заслуживает глубокого изучения — тем более что эксперты из США уже называют его серьёзным вызовом слегка, прямо скажем, забронзовевшим на лидирующих позициях продуктам американских разработчиков. В частности, ставка на архитектуру MoT позволила натренировать DeepSeek R1 всего на 2 тыс. серверных ГП Nvidia (против примерно 16 тыс., на которых обучались новейшие американские модели), и обошлась эта тренировка в эквивалентную 6 млн долл. сумму — смехотворно мало в сравнении с запредельными расходами на доведение до ума актуальных продуктов OpenAI, Anthropic и Google.
Dall-E 3 разработки OpenAI: бесплатный доступ с учётной записью Microsoft на сайте Image Creator (с российскими IP-адресами не работает).
Практически все рейтинги ИИ-генераторов изображений в Сети включают в число бесспорных лидеров модели Dall-E 3 и Midjourney. Но если первая доступна бесплатно, пусть и в ограниченном объёме, любому владельцу учётной записи Microsoft, то вторая уже достаточно давно перестала предоставлять возможность создавать даже несколько картинок в день бесплатно — как утверждается, потому, что те оказались слишком хороши и могут вводить в заблуждение ещё не знакомых с дипфейками граждан. Время от времени администрация Midjourney объявляет «день открытых дверей», предоставляя по 25 бесплатных генераций каждому зарегистрировавшемуся, но это случается крайне редко. Пользователям особенно по душе эстетика этой генеративной модели: создаваемые ею художественные образы регулярно превозносят за живописную убедительность и отменную проработку мелких деталей. Да, Dall-E 3 хвалят за реалистичность создаваемых с её помощью «фотоснимков», — но если нужно изобразить нечто фантастическое, иномирное, концептуальное, тут у Midjourney, судя по многочисленным отзывам, заведомое преимущество.
Leonardo Ai разработки Leonardo Interactive Pty Ltd: бесплатная регистрация с учётными записями Apple, Google и Microsoft, а также по e-mail.
По сути, Leonardo Ai — не веб-интерфейс для доступа к какой-то одной модели text2image, как в описанных выше случаях, а платформа для генерации с использованием нескольких БЯМ, включая уже знакомые читателям FLUX.1 в версиях [dev] и [schnell], а также модель Phoenix собственной разработки. После регистрации пользователю предоставляют 150 местных кредитов (создание одной картинки обойдётся примерно в 10), а далее пополнять свой счёт придётся уже деньгами: в отличие от проекта Civitai, кредиты просто за сам факт выкладки сгенерированного контента и за всевозможные проявления социальной активности в пределах платформы здесь не предусмотрены. Представленные на Leonardo Ai модели довольно разнообразны — в частности, дотренированная на большом массиве профессиональных фотоснимков PhotoReal соперничает по качеству, как считает ряд обозревателей, с Midjourney. Плюс к тому интерфейс веб-страницы генерации предусматривает множество настроек, от выбора соотношения сторон холста до активации ИИ-улучшителя исходной текстовой подсказки (с применением которого, как правило, результат выходит действительно более впечатляющим, чем без него).
Adobe Firefly разработки Adobe: бесплатная регистрация в том числе и по e-mail, доступ с российских IP заблокирован.
Главное достоинство генеративной модели, лежащей в основе Adobe Firefly, — это качество тренировочного массива данных, которым для неё послужила огромная библиотека из сотен миллионов изображений (по большей части фотоснимков и векторных рисунков) Adobe Stock. По этой причине в части реалистичности создаваемых ИИ изображений соперников у Firefly, особенно в актуальной, третьей её версии, не слишком много. Целый ряд «умных» сервисов, интегрированных к настоящему времени в продукты Adobe, — а это векторизация изображений, генеративное заполнение пустого пространства, наложение композиции одной картинки на изобразительную стилистику другой и ещё много чего — базируются именно на Firefly. В числе достоинств модели нередко упоминаются её «безопасность» и «этичность» — не очень понятно, правда, в какой мере этот критерий сохранит значимость на ближайшие четыре года.
Runway разработки Runway AI Inc.: бесплатная генерация доступна, регистрация в том числе по e-mail.
На протяжении всего 2024 года T2V-модели активно эволюционировали: к примеру, у команды Runway ML появилась уже третья версия ИИ-преобразователя текста в видео, Gen-3. Однако для бесплатного использования доступна лишь предыдущая версия, Gen-2 (именно в режиме text2video; «оживить» готовую картинку — преобразовать image2video, I2V — можно бесплатно, за местные кредиты, и с БЯМ Gen-3 Tirbo). После авторизации новичку становятся доступны 125 местных кредитов; создание одного четырёхсекундного ролика с соотношением сторон 16:9 (1408×768 пикселов в оригинале) обойдётся в 20. Следует иметь в виду, что даже самые современные T2V-модели не слишком уверенно справляются со сложными многофигурными композициями — даже если всё, что от них требуется, это организовать облёт виртуальной камеры вокруг более или менее статичной сцены. Для управления виртуальной камерой и сменами плана предусмотрены специальные инструменты; имеется и ИИ-улучшатель подсказок — неприметная кнопка «Enhance text prompt» (использовать её можно без дополнительной траты кредитов, кстати). Эксперты хвалят Runway за очень достойное воспроизведение человеческих лиц в динамике, в том числе за высокую точность синхронизации губ с произносимым текстом, а также за удачный встроенный прямо в веб-версию видеоредактор, но доступны эти радости (как и создание роликов продолжительностью до 16 с), тем более с модной моделью Gen-3, лишь по подписке.
Haiper разработки одноимённой компании: бесплатная генерация доступна, регистрация в том числе по e-mail.
Способов получить дополнительные кредиты на дармовщинку упомянутый выше Runway не предлагает — только перерегистрация с новым адресом либо подписка (которую из России оформить по понятным причинам нынче трудновато). Аналогичный, но эксплуатирующий свою оригинальную T2V-модель сервис Haiper, напротив, вознаграждает местной валютой (100 кредитов — сразу после регистрации; один 4-секундный ролик обойдётся тоже в 20) за разнообразную активность. Сервис хвалят за обширный инструментарий, включающий целый ряд шаблонов для создания видеозаставок, динамических логотипов, мемов и т. п., — впрочем, для новичка интерфейс ИИ-видеоредактора может показаться не самым понятным. Немалое достоинство платформы — возможность редактировать сторонние видео, загружаемые на неё, пообъектно; то есть в собственном селфи-ролике, к примеру, свою голову при помощи Haiper оператору удастся довольно органично заменить кошачьей.
В числе онлайновых инструментов для создания ИИ-видео — как T2V, так и I2V — можно ещё упомянуть сервисы FinalFrame и Pika Labs; каждый со своими плюсами и минусами, но в целом — одного поля ягоды. Строго говоря, сколько-нибудь заметных практических приложений у доступных бесплатно коротких ИИ-видео — за исключением публикации их в соцсетях ради зарабатывания лайков — пока что не просматривается. Профессиональные преобразователи презентаций и PDF в проморолики вроде Synthesia или Colossyan — дело другое, но с ними нужно учиться предметно работать, как со всяким серьёзным инструментом, да и предоставляемый ими бесплатно спектр услуг весьма ограничен. Кстати, генерировать T2V возможно и на упоминавшемся уже ИИ-медиапортале Civitai, — там доступны на момент написания настоящего обзора модели Haiper, Mochi, Kling и Hailuo, включаемые экспертами в число наиболее впечатляющих соперниц Sora разработки OpenAI (которая сама, разумеется, для доступа из РФ заблокирована), причём типичный 5-секундный ролик в разрешении 1040×720 обойдётся сразу в 300 местных кредитов.
Perplexity разработки Perplexity AI, Inc.: доступен бесплатно, без регистрации.
Поисковые машины — основа Всемирной паутины; в их отсутствие трудно было бы обеспечить стремительный рост популярности Интернета в конце 1990-х. Но теперь на смену простым по сути (сейчас где-то наверняка скептически ухмыльнулся не один SEO-оптимизатор), картотечным цифровым поисковикам приходят ИИ-системы — наиболее известна среди которых как независимый проект, наверное, именно Perplexity. Сегодня по меньшей мере опциональная ИИ-обработка пользовательского запроса встроена уже во множество классических машин, от Google и Bing до Brave Search; более того, ChatGPT уже готов выдавать ответы не только с опорой на тот массив данных, на котором была исходно натренирована лежащая в его основе БЯМ, но и с анализом позаимствованных из Интернета релевантных данных, однако как один из пионерских самостоятельных проектов упоминания Perplexity однозначно заслуживает. Хотя бы потому, что у его лица, если можно так выразиться, — своё, необщее выраженье: ответы системы на поисковые запросы склонны к академической полноте, представлены чаще всего в виде упорядоченных по пунктам перечней, сопровождаются обширным набором ссылок — и в целом более прочих напоминают именно выдачу ИИ-бота, а не результат работы поисковика. Увы, во многом это относится к форме, а не к содержанию: как и любой генеративный ИИ, Perplexity склонен к галлюцинациям (и вот тут крайне уместны ссылки, по которым сразу можно проверить показавшиеся сомнительными данные) и не слишком здорово справляется с поиском изображений.
You.com разработки одноимённой компании: доступен бесплатно, но на запросы с российских IP, хотя формально их и не блокирует, выдаёт ошибку.
Действующий с конца 2021 г. (т. е. запущенный ещё до начала всеобщей ИИ-эры!) умный поисковик на деле тоже уже является платформой, предлагая пользователям — в основном, конечно же, платным — и чат-бот, и генератор изображений, и специализированную БЯМ для написания текстов различной направленности, включая художественные, коммерческие и посты для соцсетей. Особый YouAgent готов помочь программистам не только в создании кода, но и в его отладке — написанный фрагмент можно запустить тут же, в виртуальном окружении, чтобы проверить на работоспособность. Главной особенностью You.com его разработчики считают гарантированную приватность: компания, если верить её заявлениям, не продаёт данные зарегистрировавшихся пользователей рекламодателям, что в условиях экономики внимания (которая до сих пор, невзирая на макроэкономические неурядицы глобального масштаба, продолжает в целом функционировать) можно считать весомым аргументом в её пользу. Правда, списка ссылок на источники одновременно со сгенерированным ответом система не предоставляет — желающим верифицировать полученные данные придётся прилагать дополнительные усилия.
Brave Search, разработка Brave Software, Inc.: доступен бесплатно, без регистрации.
Поисковик Brave, стартовавший именно как альтернативная крупным проектам поисковая машина, ещё безо всякого ИИ, также декларирует максимальную сохранность пользовательских данных — вплоть до блокировки трекеров и рекламных баннеров на сайтах, посещаемых через одноимённый веб-браузер. Впрочем, запускать поиск Brave можно из любого браузера, равно как и активировать ИИ-помощник, встроенный прямо в интерфейс стандартной выдачи данных. Помимо кнопки «Answer with AI», для этого ничего не потребуется, да и самый обычный поиск нередко безо всякого прямого указания на то пользователя будет сопровождаться обстоятельным, снабжённым всеми необходимыми ссылками ответом, сгенерированным БЯМ. Особенно важно (и, кстати, полностью соответствует заявленной заботе о приватности), что эта языковая модель — своей собственной разработки, а не вызов через API штатных ИИ-поисковиков Google либо Microsoft, чем грешат многие подобные сервисы, в особенности предлагаемые в виде браузерных расширений или обособленных смартфонных приложений.
В целом Интернет сегодня буквально ломится от доступных, в том числе и (частично) бесплатно, ИИ-инструментов, включая агенты для создания веб-сайтов, средства автоматизации графического дизайна, инструменты разработки смартфонных приложений, «озвучиватели» текста вполне человеческим (или не совсем человеческим, если пользователь того пожелает) голосом, генераторы музыкальных композиций и многое, многое другое. Многие из них, кстати, используют ИИ-модели с открытыми весами, которые, по крайней мере теоретически, возможно запускать локально, — и это может стать неплохой альтернативой поиску окольных путей обхода заблокированного для российских IP-адресов доступа или же способов оплаты тех сервисов из недружественных юрисдикций, которые в ней нуждаются.
Материалы по теме: