Сегодня 27 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → сбер
Быстрый переход

«Сбер» обновил GigaChat — ИИ-чат-бот получил одну из крупнейших нейросетей на русском языке

В рамках международной конференции по искусственному интеллекту AI Journey разработчики «Сбера» представили новую версию чат-бота GigaChat, основой которого стала одна из самых продвинутых больших языковых моделей (LLM) для русского языка с 29 млрд параметров. В скором времени доступ к API новой версии алгоритма получат бизнес-клиенты «Сбера», что позволит им создавать собственные решения на базе GigaChat, а также участники академического сообщества для проведения исследований.

 Источник изображения: sber.ru

Источник изображения: sber.ru

Использование новой LLM позволяет чат-боту лучше следовать инструкциям и выполнять сложные задания. Существенно повысилась качество суммаризации, рерайтинга, редактирования текстов и ответов на различные вопросы. Разработчики сравнили ответы новой и предыдущей моделей и зафиксировали общее повышение качества на 23 %. В дополнение к этому с фактологией новая модель справляется на 25 % лучше предшественницы.

Для повышения качества работы LLM было проведено множество экспериментов по наращиванию эффективности её обучения. К примеру, использовался фреймворк для обучения больших языковых моделей с возможностью шардирования весов нейросети по видеокартам, за счёт чего удалось сократить потребление памяти на них. Результат внутренней оценки в бенчмарке Massive Multitask Language Understanding показал, что версия GigaChat с 29 млрд параметров превосходит самый популярный открытый аналог LLaMA 2 34B.

«Обучение моделей, лежащих в основе GigaChat, — это масштабный и сложный вычислительный проект, прежде мы не делали ничего подобного. Суммарное количество вычислительных операций почти в 6 раз превысило количество операций при обучении модели ruGPT-3 с 13 млрд параметров в 2021 году. Также специально для GigaChat мы собрали и развиваем уникальный датасет, над которым работают сотни сотрудников «Сбера», помогая развивать и улучшать качество ответов в самых разных доменах. Благодаря этим усилиям пользователи с каждым новым релизом GigaChat получают максимум от сервиса для решения своих задач», — рассказал Андрей Белевцев, старший вице-президент, руководитель блока «Технологии» Сбербанка.

«Сбер» представил нейросеть Kandinsky Video — она генерирует 8-секундные видео по текстовому описанию

«Сбер» представил нейросеть Kandinsky Video, способную создавать небольшие ролики по текстовому описанию. Алгоритм генерирует видеоряд продолжительностью до 8 секунд с частотой 30 кадров в секунду. Новинка была презентована в рамках конференции AI Journey первым заместителем председателя правления «Сбербанка» Александром Ведяхиным.

 Источник изображения: sberbank.com

Источник изображения: sberbank.com

Архитектура Kandinsky Video включает в себя два основных блока. Первый блок отвечает за генерацию ключевых кадров, используемых для создания структуры сюжета видео, а второй — генерирует интерполяционные кадры, за счёт чего достигается плавность движения в финальном ролике. Оба блока построены на базе модели синтеза изображений по текстовым описаниям Kandinsky 3.0.

В конечном счёте алгоритм создаёт видео с движением как объекта, так и фона. Это отличает сгенерированные нейросетью видео от анимационных роликов, в которых динамика достигается за счёт моделирования полёта камеры относительно статичной сцены. В настоящее время Kandinsky Video может создавать видео с разрешением 512 × 512 пикселей и разным соотношением сторон. Для обучения алгоритма использовался датасет из более чем 300 тыс. пар «текст-видео». Сам же процесс генерации ролика занимает до 3 минут.

Отмечается, что ранее некоторые пользователи нейросети Kandinsky 2.2 в тестовом режиме получили доступ к функции создания анимационных роликов. Всего одного запроса достаточно для генерации видео продолжительностью до 4 секунд с выбранными эффектами анимации, частотой 24 кадра в секунду и разрешением 640 × 640 пикселей. Пользователи новой версии Kandinsky 3.0 также могут генерировать ролики по текстовому описанию в режиме анимации.

«Сбер» представил ИИ-художника Kandinsky 3.0 — он стал точнее и изучил отечественный культурный код

«Сбер» представил на конференции AI Journey обновлённую генеративную модель искусственного интеллекта Kandinsky 3.0, предназначенную для создания изображений. Она научилась лучше понимать текстовые запросы пользователей, стала генерировать более фотореалистичные изображения, художественные картины и наброски.

 Источник изображений: sberbank.com

Источник изображений: sberbank.com

Одним из важнейших нововведений Kandinsky 3.0 стало обучение нейросети элементам отечественного культурного кода — это коснулось советских и российских знаменитостей и персонажей, архитектурных достопримечательностей, культурных объектов и объектов народного творчества: в частности, нейросеть знакома с гжелью. Разработчик усовершенствовал функцию редактирования изображения и возможность дорисовки картины в режиме бесконечного полотна.

По умолчанию Kandinsky 3.0 генерирует картинки c разрешением 1024 × 1024 пикселей, но есть возможность выбрать другое соотношение сторон. При обучении разработчик использовал массив из 1,5 млрд пар изображений с текстовыми описаниями. Нейросеть также получила поддержку генерации 4-секундных видеороликов по текстовому описанию — они имеют разрешение 640 × 640 пикселей с частотой 24 кадра в секунду. Генерация одной секунды видео занимает примерно 20 секунд. Модели анимации включают перемещения объектов, их приближение, удаление и другие приёмы. Основу алгоритма составляет перерисовка изображения по текстовому описанию.

Поработать с моделью Kandinsky 3.0 можно на платформе fusionbrain.ai, на сайте rudalle.ru, при помощи ботов в Telegram и «ВКонтакте», в переписке с чат-ботом GigaChat, в приложениях «СберБанк Онлайн» и «Салют», а также в умных устройствах от «Сбера» по команде «запусти художника». Доступ к созданию анимации в Telegram производится по предварительной заявке.

В «МойОфис» интегрировали GigaChat — ИИ от «Сбера», который помогает писать текст, разбирать почту и не только

Компания «МойОфис», разрабатывающая одноимённый аналог Microsoft Office, интегрировала разработанную «Сбером» платформу искусственного интеллекта GigaChat в свой программный пакет. Нейросеть также стала частью почтового клиента Mailion и рабочего мессенджера Squadus, сообщают «Ведомости».

 Источник изображения: sber.ru

Источник изображения: sber.ru

Встроенный в офисные редакторы GigaChat генерирует тексты и помогает в создании шаблонов ответов — компания разработала визуальный конструктор, в котором нейросеть готовит или редактирует документы в заданном пользователем стиле или сообразно планируемой задаче. В почтовом клиенте ИИ создаёт краткие сводки писем в цепочке переписки и помогает формировать на их основе задачи; в мессенджере он создаёт панель задач и события в календаре.

Сейчас «МойОфис» и «Сбер» прорабатывают механизмы монетизации совместного проекта, но свои объёмы инвестиций и коммерческие условия сотрудничества стороны предпочли не раскрывать. «Сбер» является первым партнёром компании «МойОфис», но партнёрство не носит эксклюзивного характера — разработчик офисного ПО готов к сотрудничеству с другими компаниями из сферы ИИ.

Интеграция нейросетей в офисные пакеты — не новое, но перспективное направление, отметили опрошенные «Ведомостями» эксперты. Первым здесь оказался Microsoft 365 Copilot: он пишет тексты в Word, помогает с анализом данных в Excel, генерацией презентаций в PowerPoint и с работой с почтой в Outlook. Аналогичные инструменты добавила в свои службы компания Google. Основу сервиса Copilot составила платформа ChatGPT — ещё в феврале число её пользователей превысило 100 млн, а аудитория GigaChat от «Сбера» в сентябре достигла 1 млн пользователей. Пользователям обеих платформ, добавили эксперты издания, следует помнить о склонности ИИ к «галлюцинациям»: они не всегда отличают правду от лжи и иногда сообщают не соответствующую действительности информацию.

«Сбер» запретил ИИ-художнику Kandinsky генерировать изображения с государственной символикой

«Сбер» скорректировал работу нейросети Kandinsky 2.1 после вызова сотрудников компании в прокуратуру из-за генерации изображения на флаге России. Об этом сообщил председатель правления Сбербанка Герман Греф на пленарной сессии форума Finopolis 2023.

 Источник изображений: sberbank.com

Источник изображений: sberbank.com

Греф рассказал, что вскоре после запуска ИИ-алгоритма сотрудников «Сбера» вызвали в прокуратуру. Поводом для этого стало обращение депутатов Госдумы после того, как нейросеть нарисовала на государственном флаге России купола собора Василия Блаженного. «Депутаты посчитали, что это издевательство над нашими национальными флагами. Соответственно, мы тут же остановились. Определённые вещи — символы государственные и прочее — она не генерирует уже», — сообщил Герман Греф.

Теперь алгоритм Kandinsky 2.1 по запросу пользователя выдаёт заранее заданное изображение без добавления к нему каких-либо иных элементов на его основе. «Но при этом она теряет в генерации», — отметил топ-менеджер Сбербанка, добавив, что в течение полугода «Сбер» корректировал настройки нейросети, из-за чего доступная широкому кругу пользователей версия алгоритма «потеряла 12 % в креативности и точности».

Господин Греф также сказал, что при развитии технологий на основе искусственного интеллекта компаниям требуются, прежде всего, «снисхождение и понимание» со стороны органов власти. Что касается разбирательства в прокуратуре, то оно закончилось без последствий для банка. «Хорошо, что прокурор современный попался, с чувством юмора: он всё изучил, слава богу, нас никуда не привлекли», — резюмировал Греф.

«Сбер» объяснил, почему отключил услугу пополнения российских аккаунтов Steam

Не успели пользователи «СберБанк Онлайн» нарадоваться открывшейся им возможности пополнять российские аккаунты Steam со сравнительно небольшой комиссией, как такая опция из списка услуг пропала. Что произошло?

 Источник изображения: Sega

Источник изображения: Sega

В результате введённого «Сбером» без предупреждения ограничения пополнить кошелёк Steam через «СберБанк Онлайн» теперь можно исключительно для американского аккаунта в сервисе Valve.

В ответ на вопросы, оставленные в комментариях к не связанной с ситуацией записи в соцсети «ВКонтакте», администрация официального сообщества «Сбера» объяснила, почему из «СберБанк Онлайн» пропала опция пополнения российских аккаунтов Steam.

 Источник изображения: Mundfish

Источник изображения: Mundfish

Представители банка подтвердили, что у пользователей «СберБанк Онлайн» пока что остаётся возможность «пополнения только на номинальную сумму аккаунта, который зарегистрирован в США».

«Российский аккаунт нельзя пополнить согласно 259-ФЗ, на территории РФ запрещено использование цифровой валюты, к которой относятся средства на кошельке Steam», — объяснили в «Сбере».

 Источник изображения: Reddit (V4NT0M)

Источник изображения: Reddit (V4NT0M)

Закон 259-ФЗ «О цифровых финансовых активах», в частности, запрещает распространение информации о предложении и/или приёме цифровой валюты в качестве встречного предоставления за товары, работы и услуги.

Таким образом, функция прямого пополнения кошелька Steam просуществовала в «СберБанк Онлайн» меньше суток. Аналогичная услуга в банке «Тинькофф» летом продержалась около двух дней.

«Сбер» открыл возможность напрямую пополнить кошелёк российского аккаунта Steam через «СберБанк Онлайн», но почти тут же закрыл

В ночь со 2 на 3 ноября пользователи российского Steam обнаружили новый способ прямого пополнения внутреннего кошелька в сервисе — соответствующая услуга появилась в банке «Сбер». Обновление: вскоре после обнаружения опция из списка услуг банка пропала. В «Сбер» ситуацию пока не комментировали.

 Источник изображения: Steam (Charuru)

Источник изображения: Steam (Charuru)

На момент публикации пополнение баланса кошелька Steam доступно через мобильное приложение и сайт «СберБанк Онлайн». Опцию можно найти среди категорий («Платежи и переводы»/«Отдых и развлечения»/«Игры») или через поиск.

Для проведения перевода от пользователя требуется ввести логин Steam и сумму (от 100 до 15 000 рублей). Судя по первым отзывам, способ работает как минимум с российскими и казахстанскими учётными записями.

 Источник изображения: «СберБанк Онлайн»

Источник изображения: «СберБанк Онлайн»

Пополнение кошелька Steam через «Сбер» сопровождается комиссией в районе 6 % (до аккаунта доходит около 940 из 1000 рублей), что в сложившейся ситуации можно назвать вполне выгодным предложением.

Для сравнения: в сервисе QIWI при переводе средств на российский аккаунт Steam комиссия может достигать 10 %, а в банке «Тинькофф» она составляла 8−9 %. Как долго функция будет доступна в «Сбер», неясно.

 Источник изображения: Steam

Источник изображения: Steam

Напомним, в «Тинькофф» опция прямого пополнения кошелька Steam открылась на исходе июля, однако буквально на следующий день возможность пропала (опцию отключил провайдер) и в строй до сих не вернулась.

Valve заблокировала основные способы оплаты в российском Steam прошлой весной. Вдобавок к этому ограничению из российского Steam ушли многие крупные компании, включая Activision, EA, Microsoft, Sony, Take-Two, Ubisoft и другие.

У чат-бота GigaChat повысилось качество ответов — «Сбер» внедрил ИИ-модель нового поколения

«Сбер» представил ИИ-модель GigaChat нового поколения, в которой благодаря изменению подхода к обучению значительно улучшились практически все умения чат-бота, от сокращения текстов и ответов на вопросы до генерации идей. Размер обрабатываемого текста был увеличен в два раза. Новая модель уже доступна для всех пользователей GigaChat.

 Источник изображения: Сбер

Источник изображения: Сбер

Общаться с GigaChat теперь можно в соцсети «ВКонтакте», для чего достаточно его активировать. Как сообщается, чат-бот способен генерировать тексты, создавать изображения по текстовому запросу с помощью модели Kandinsky, а также придумывать «идеи на все случаи жизни».

Если в ходе использовании сервиса общение зашло в тупик или необходимо сменить тему, достаточно нажать кнопку «Новый диалог». Нажав кнопку «Обо мне», пользователь услышит рассказ GigaChat о себе, а опция «Написать в поддержку» поможет решить возникшие в процессе использования сервиса проблемы. Нажав кнопку «Добавить в чат» можно продолжить общение с GigaChat в рабочем или семейном чате, указав @gigachat в переписке.

Как отметил Денис Филиппов, вице-президент по цифровым решениям «Салют» Сбербанка, количество уникальных пользователей GigaChat достигло 1 млн. По его словам, ИИ-модель нового поколения GigaChat значительно превосходит по ряду показателей предшественника. «Наиболее впечатляющий прогресс достигнут в суммаризации, когда пользователю нужна выжимка из большого текста, чтобы не читать его целиком. По суммаризированному тексту можно получить ответы на любые вопросы или попросить сформулировать ключевые мысли», — сообщил он.

С сентября этого года GigaChat доступен всем пользователям умных устройств Sber, а также в мобильном приложении «Салют» для Android-устройств. Корпоративные пользователи могут с помощью программного интерфейса GigaChat API создавать собственные ИИ-решения и оптимизировать бизнес-процессы.

«Сбер» заинтересовался разработкой софта для проектирования чипов

«Сбер» проявляет интерес к сфере производства полупроводниковой продукции. Инженеры компании разрабатывают софт, который за счёт искусственного интеллекта должен ускорить выпуск микроэлектроники на полупроводниковых заводах. Подробности касательно данного вопроса будут представлены на конференции «Технологии «Сбера» для полупроводниковых производств», которая состоится в рамках форума «Микроэлектроника 2023», проходящего в Сочи с 9 по 14 октября.

 Источник изображения: Kevin Ku/unsplash.com

Источник изображения: Kevin Ku/unsplash.com

В сообщении сказано, что на мероприятии будут представлены «видение и возможности Сбера по автоматизации производства». Речь идёт о разработках, связанных с технологией инверсивной литографии, позволяющей за счёт использования больших вычислительных мощностей и ИИ-технологий ускорить процесс проектирования фотошаблонов, используемых для переноса рисунка чипа на кремниевую пластину.

Разработку фотошаблонов, как правило, осуществляют заводы-производители или отдельные компании соответствующей специализации, так называемые маск-шопы. После того, как дизайн-центр завершает проектирование процессора, он обращается к специалистам для создания фотомаски. Вычисления для подготовки маски выполняются в специальных системах автоматизированного проектирования, работающих на мощностях дата-центров. Производство современных чипов требует создания набора масок, сложность и количество которых растёт вместе с уровнем устройства.

Разработкой софта для ускорения проектирования шаблонов занимаются разные компании, такие как NVIDIA. Ранее в этом году NVIDIA представила программную библиотеку cuLitho, которая позволяет ускорить разработку фотошаблонов благодаря переносу вычислительной нагрузки с центральных процессоров на графические, за счёт чего процесс ускоряется в десятки раз. По данным источника, инженеры «Сбера» работают над созданием алгоритма, который позволит проектировать маски и рассчитывать оптические искажения с помощью нейросетей, а не стандартных способов расчёта.

Программа форума «Микроэлектроника» также указывает на то, что «Сбер» является организатором круглого стола, посвящённого процессорной архитектуре RISC-V. Об интересе банка к этой архитектуре говорят другие источники на рынке микроэлектроники. Официальные представители «Сбера» пока воздерживаются от комментариев по данному вопросу.

ИИ-чат-бот GigaChat от «Сбера» стал доступен всем желающим

«Сбер» открыл общий доступ к основанному на искусственном интеллекте чат-боту GigaChat — воспользоваться сервисом сможет любой желающий. Компания также предложила бесплатный курс по работе с платформой — он может оказаться полезным менеджерам, маркетологам, редакторам и представителям других профессий.

 Источник изображения: sber.ru

Источник изображения: sber.ru

Для работы с GigaChat в веб-интерфейсе необходимо войти в систему при помощи «Сбер ID». Платформа выступает в качестве чат-бота, генерируя тексты или предлагая их редактирование; к ней также подключена нейросеть Kandinsky, позволяющая генерировать изображения. Пользователи чат-бота теперь могут делиться историями переписки с ним. Более подробно возможности GigaChat описаны в базе знаний «Сбера».

«Сбер» представил передового чат-бота в апреле. На начальном этапе платформа работала в режиме тестирования через мессенджер Telegram. В основе GigaChat лежит общедоступная нейросеть ruGPT-3.5 с 13 млрд параметров с поддержкой длины контекста в 2048 токенов. В августе чат-бот был интегрирован с голосовым помощником «Салют» в умных колонках SberBoom и SberBoom Mini.

«Сбер» и «Яндекс» готовят аналоги GitHub Copilot, чтобы ускорить создание программного кода

«Сбер» и «Яндекс» проявляют интерес к созданию сервисов для разработчиков на базе искусственного интеллекта (ИИ), который подобно ИИ-системе GitHub Copilot сможет оказывать помощь программистам в написании кода. По данным «Коммерсанта», «Сбер», представивший ранее генеративную нейросеть GigaChat, уже создал инструмент разработки и автодополнения кода GigaCode.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Как сообщает «Коммерсантъ», программа GigaCode/JARVIS, поддерживающая различные языки программирования, была зарегистрирована «Сбером» в реестре Роспатента 8 августа, а за несколько дней до этого, 3 августа банк зарегистрировал домен gigacode.ru, на котором сейчас располагается страница входа в сервис JARVIS. Сообщается, в настоящий момент сервис доступен только для работников «Сбера», но в ближайшее время им смогут воспользоваться и внешние разработчики.

В апреле «Сбер» представил мультимодальную нейросеть GigaChat на ИИ-платформе NeONKA, способную генерировать фрагменты кода. По словам представителя банка, GigaCode «развивается параллельно с GigaChat и имеет ряд пересечений». Сервис может интегрироваться с популярными средами разработки, такими как IntelliJ IDEA и PyCharm от JetBrains, Visual Studio Code от Microsoft и т. д.

В свою очередь, «Яндекс», представивший в этом году генеративную нейросеть YandexGPT, сообщил «Коммерсанту», что рассматривают возможность создания продуктов для разработчиков, но сейчас занимается интеграцией нейросетей в сервисы для массовых пользователей.

По словам экспертов, качество, с которым языковая модель способна сгенерировать код, невысоко, но всё же такие инструменты можно использовать для написания отдельных участков кода, методов и функций. Подобный сервис позволит ускорить разработку и автоматизировать выполнение рутинных операций, но их массовое внедрение увеличит порог вхождения в профессию, говорят они.

Голосовой помощник «Салют» в умных колонках SberBoom получил поддержку GigaChat

Владельцы умных колонок SberBoom и SberBoom Mini с голосовым помощником «Салют» получили возможность воспользоваться сервисом GigaChat — разработанным «Сбером» чат-ботом на основе алгоритмов искусственного интеллекта. В ближайшее время функция появится на всей линейке устройств с «Салютом», а для запуска новой функции предусмотрена команда: «Салют, включи GigaChat».

 Источник изображения: sberdevices.ru

Источник изображения: sberdevices.ru

Пользователь может отправить команду платформе на генерацию текста по заданным параметрам: ИИ способен сочинить сказку, поздравительную речь, предложить варианты подарка, обсудить идею или придумать шутку, новый рецепт, пошаговую инструкцию, а также составить план тренировок. GigaChat владеет контекстом разговора и может настраиваться по желанию пользователя, делая ответы более детализированными или меняя стиль, жанр и объём генерируемого текста.

Чат-бот работает на основе нейросетей NeONKA (NEural Omnimodal Network with Knowledge-Awareness), которая включает несколько моделей, обученных с использованием методов supervised fine-tuning и reinforcement learning with human feedback. В нейросетевую инфраструктуру входит и модель Kandinsky, благодаря которой GigaChat также поддерживает создание изображений.

«Сбер» представил антисанкционные устройства умного дома на российской облачной платформе

«Сбер» представил обновлённую линейку устройств, работающих на отечественной облачной инфраструктуре — они поддерживают беспроводной протокол с низким энергопотреблением Zigbee 3.0 и позволяют создавать различные сценарии автоматизации жилища.

 Источник изображения: sberdevices.ru

Источник изображения: sberdevices.ru

В комплект нового оборудования вошли: управляющий хаб; сценарная кнопка; датчики движения, открытия, температуры и влажности; розетка Wi-Fi с защитой от скачкой напряжения. Всё оборудование работает на российской облачной платформе — эта мера потребовалась в условиях санкционного давления.

Датчики позволяют настроить в помещении систему климат-контроля, установить сценарии автоматического включения и отключения освещения и бытовых приборов — всё прочее можно настроить при помощи сценарной кнопки. Оборудование поддерживает экономичный беспроводной протокол Zigbee 3.0, обеспечивающий связь компонентов умного дома между собой. Центральным компонентом является хаб, совместимый с устройствами экосистем Aqara и Sonoff.

Ещё одним важным устройством стала розетка Wi-Fi, которая превращает в «умные» все подключённые к ней приборы. К примеру, при понижении влажности воздуха в помещении можно автоматически запускать увлажнитель воздуха. Розетка также обладает защитой от скачков напряжения — при срабатывании защиты подключённые к розетке приборы отключаются. Поддерживаются потребители мощностью до 3680 Вт (ток до 16 А). Предусмотрено и предотвращение перегрева — в розетку встроен температурный датчик.

«Сбер» выложил в открытый доступ русскоязычную ИИ-модель ruGPT-3.5

Инженеры «Сбера» выложили в открытый доступ нейросетевую модель ruGPT-3.5, лежащую в основе сервиса GigaChat, который до сих пор проходит стадию закрытого тестирования. Лицензия MIT позволяет использовать материалы проекта в коммерческих целях.

 Структура датасета ruGPT-3.5. Источник изображения: habr.com

Структура датасета ruGPT-3.5. Источник изображения: habr.com

Важнейшим недостатком открытых больших языковых моделей вроде Meta LlaMA является ограниченная поддержка русского языка — обычно это русский раздел «Википедии» и некоторое количество общедоступных текстов. Это оказывает негативное влияние на понимание моделью языка и качество её ответов. Модель ruGPT-3.5, основанная на архитектуре OpenAI GPT-3, создана в первую очередь для работы в русскоязычной среде, поэтому она более качественно обрабатывает такие запросы.

Обучение модели производилось в два этапа. Первый этап продлился 1,5 месяца — за это время платформа обработала 300 Гбайт данных: книги, энциклопедийные и научные статьи, социальные ресурсы и другие источники. Потребовались ресурсы 512 ускорителей NVIDIA V100. На втором этапе проводилось дообучение на 110 Гбайт данных из датасета The Stack, юридических документов и обновлённых текстов «Википедии» — это заняло три недели и потребовало 200 ускорителей NVIDIA A100.

В результате у ruGPT-3.5 13 млрд параметров при длине контекста 2048 токенов — для сравнения, привели пример разработчики, рассказ А. П. Чехова «Хамелеон» разбивается на 1650 токенов при его длине в 901 слово.

«Сбер» научил нейросеть Kandinsky генерировать стикеры и фотореалистичные изображения и портреты

«Сбер» представил новую версию своей нейросети для генерации изображений по текстовому описанию — Kandinsky 2.2, которая позволит создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации, а также обеспечит значительный прирост качества при создании портретов.

 Генерация Kandinsky 2.2           Источник изображений: «Сбер»

Генерация Kandinsky 2.2. Источник изображений: «Сбер»

Для дообучения Kandinsky 2.2 использовался набор данных из 1,5 млрд пар «текст — изображение», что на 300 млн больше, чем для предыдущей версии — Kandinsky 2.1, вышедшей в апреле этого года и набравшей всего за 6 дней 2 млн пользователей.

Новую версию модели научили создавать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также благодаря внедрению специального структурного блока управляемых изменений ControlNetона она получила способность изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя при этом композицию исходной иллюстрации.

 Генерация Kandinsky 2.2

Генерация Kandinsky 2.2

Согласно пресс-релизу, Kandinsky 2.2 понимает запросы на русском и английском языках, обладает способностью рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, а также дорисовывать недостающие части картинки (inpainting) и создавать картины в режиме бесконечного полотна (outpainting).

 Стикерпак от Kandinsky 2.2

Стикерпак от Kandinsky 2.2

«Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации», — сообщил первый зампред правления Сбербанка Александр Ведяхин, добавив, что, как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе, и протестировать её можно совершенно бесплатно.

Сообщается, что ознакомиться с возможностями Kandinsky 2.2 можно на промостранице модели, на платформе FusionBrain.AI, в Telegram-боте и боте соцсети «ВКонтакте», а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют. Модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.

Разработкой и обучением нейросети занимались исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.


window-new
Soft
Hard
Тренды 🔥
Дешёвые сканеры штрихкодов помогли в кратчайшие сроки восстановить пострадавшие от CrowdStrike компьютеры 4 ч.
Новая статья: Flintlock: The Siege of Dawn — хорошие идеи в неудачной обёртке. Рецензия 4 ч.
Анонсирован китайский ролевой детектив Kill the Shadow, напоминающий смесь Disco Elysium и The Last Night 5 ч.
Соцсеть X начала без уведомления использовать данные пользователей для обучения Grok 7 ч.
Mirthwood получила новый трейлер и дату выхода — это ролевой симулятор жизни в фэнтезийном мире, вдохновлённый Fable, Stardew Valley и The Sims 7 ч.
Журналисты выяснили, какие игры пострадают от забастовки актёров озвучки — GTA VI в безопасности 9 ч.
Разработчики Gran Turismo 7 извинились за баг, который запускает машины в космос 10 ч.
Хинштейн пояснил, почему в России замедлится YouTube 10 ч.
Windows 11 сможет добавлять синхронизированный с ПК Android-смартфон в «Проводник» 10 ч.
Заказы на ИИ и мейнфреймы z16 помогли IBM увеличить выручку и прибыль 11 ч.