Бум технологий машинного обучения и систем искусственного интеллекта (Artificial Intelligence, AI) на базе нейронных сетей привёл к появлению на софтверном рынке множества инновационных приложений и сервисов, по функциональным возможностям на голову превосходящих классические программные решения. Мы изучили ассортимент «умных» продуктов и выбрали среди них самые оригинальные разработки, воспользоваться которыми может каждый.
⇡#
Нейросетевой помощник для программистов GitHub Copilot
Разработчики: Microsoft и OpenAI.
Сайт проекта: copilot.github.com.
Система на базе искусственного интеллекта, которая может давать советы по написанию кода разработчикам программного обеспечения. Представляет собой результат совместных усилий специалистов компании Microsoft и стартапа OpenAI, занимающегося исследованиями в области технологий электронного разума.
GitHub Copilot полагается на внушительный багаж знаний в различных языках программирования, алгоритмических правилах, принципах и методах разработки ПО. Инструмент выступает в качестве напарника программиста: он анализирует существующий и набираемый код, комментарии к нему, местоположение курсора и предлагает в зависимости от контекста советы по доработке тех или иных строк и функций. По мере того, как программист принимает или отклоняет предложения, положенная в основу сервиса AI-модель обучается, адаптируется к стилю разработчика и со временем становится ещё более умной. Copilot интегрирован с широко востребованным в профессиональной среде репозиторием GitHub и может использоваться в средах разработки Visual Studio Code, Neovim, JetBrains. Система поддерживает практически все популярные языки программирования, но лучше всего на данный момент работает с Python, JavaScript, TypeScript, Ruby и Go.
⇡#Сервис Aimyvoice для создания синтезированных голосов
Разработчик: Just AI.
Сайт проекта: aimyvoice.com.
Платформа, позволяющая создавать ИИ-модели голосов различных персонажей или известных личностей и затем использовать их для синтеза речи в различных проектах, таких как озвучивание игр, аудиокниг, подкастов, голосовых помощников, ботов, служб поддержки, поздравительных открыток, рекламы и многого другого.
Чтобы синтезировать голосовую модель, необходимо зарегистрироваться на сайте Aimyvoice и загрузить аудиофайл с записью голоса — своего собственноголибо конкретного персонажа или человека. При этом запись должна содержать не менее 10 часов живой речи, а её обработка и обучение голосовой модели могут занять около недели. Готовую модель можно как применять для личных нужд, так и разместить в каталоге сервиса для использования другими пользователями.
Важной особенностью платформы является защита интересов правообладателей, актёров и студий. В частности, возможности Aimyvoice позволяют определять необходимость согласования синтезируемых голосовых моделей с правообладателями и заключения договоров на их использование с последующим отчислением лицензионных выплат. Например, средствами сервиса можно без труда воссоздать голос небезызвестного кота Матроскина из Простоквашино, разговаривающего устами Олега Табакова, но для его использования потребуется разрешение мультипликационной студии «Союзмультфильм». Разработчики проекта свято чтут копирайт, и такая позиция заслуживает уважения.
Разработчик: DeepL.
Сайт проекта: deepl.com/translator.
Онлайновый переводчик, поддерживающий 26 языков и 110 направлений перевода (языковых пар). Особенностью DeepL Translator является продвинутый AI-движок, нейросетевые алгоритмы которого обучены на основе миллионов переведённых текстов различной тематики и умеют не только улавливать связь между словами, но и «понимать» смысл предложений. Благодаря этому и знанию лингвистических нюансов для каждой предметной области обеспечивается максимально точный и корректный перевод, качество которого подтверждается многочисленными сравнительными тестами и отзывами пользователей.
Сервис позволяет обрабатывать как обычные тексты, так и файлы PDF, Word (.docx), PowerPoint (.pptx) с сохранением форматирования документов. Взаимодействовать с переводчиком можно как из браузера, так и с помощью клиентских приложений, доступных для Windows, macOS и iOS. Бесплатная версия DeepL Translator имеет ряд ограничений, в том числе по количеству символов и объёму перевода. Для полноценного использования сервиса предлагается оформить подписку, стоимость которой начинается от 6 евро в месяц. Также доступен API-интерфейс для встраивания переводчика в сторонние программные продукты.
⇡#Сервис закадрового перевода видео
Разработчик: «Яндекс».
Сайт проекта: yandex.ru/company/technologies.
Значимых успехов в стирании языковых барьеров удалось добиться команде «Яндекса», активно совершенствующей собственную технологию машинного перевода видео, которая позволяет смотреть с русской озвучкой ролики на английском, немецком, французском и испанском языках. Автоматический закадровый перевод работает в «Яндекс.Браузере» для Windows, macOS, Linux и Android, а также в фирменном приложении «Яндекса» для iOS и Android. Чтобы запустить перевод, нужно нажать на кнопку с логотипом «Яндекс.Переводчика». Переводить можно ролики, размещённые на YouTube, Vimeo, Twitch и ещё нескольких популярных платформах. Главное, чтобы видео находилось в общем доступе, а его продолжительность не превышала 4 часов.
В сервисе видеоперевода задействованы сразу несколько технологий «Яндекса» — в первую очередь это распознавание речи, синтез речи, биометрия и машинный перевод, в основу которых положены сложные нейросетевые модели. Сначала система распознавания речи преобразует сказанное в кадре в текст, расставляет знаки препинания и распределяет слова по смысловым сегментам. Затем технология машинного перевода переводит полученный текст на русский язык, а модуль синтеза речи озвучивает результат, который накладывается на видео таким образом, чтобы фразы в оригинале и в переводе совпадали друг с другом по длине. Перевод, который выполняет «Яндекс», получается двухголосым, с приглушённой оригинальной звуковой дорожкой. При этом мужские голоса переводятся мужским голосом, женские — женским. В ближайших планах разработчиков — освоение новых языковых пар и использование в системе перевода большего количества голосов.
⇡#Нейросеть ruDALL-E для генерации картинок по описанию
Разработчики: SberDevices и Sber AI.
Сайт проекта: rudalle.ru.
Совместная разработка команд SberDevices и Sber AI (входят в экосистему «Сбера»), которая способна создавать изображения на основе текстового описания на русском языке. Может быть использована как для оценки возможностей искусственного интеллекта, так и в практических целях, например для генерации свободных от авторских прав и лицензионных отчислений иллюстраций, которые можно применять в коммерческих целях.
AI-система ruDALL-E развёрнута в облачной инфраструктуре SberCloud, а для обучения положенных в её основу ИИ-моделей был задействован суперкомпьютер «Кристофари» (Christofari), один из самых высокопроизводительных вычислительных комплексов в России на данный момент. Создание изображений происходит в три этапа: сначала одна нейросеть анализирует текстовый запрос и генерирует заданное количество картинок, затем следующая выбирает, какие из них наиболее удачны и максимально соответствуют описанию, а третья увеличивает их в размере без потери качества. Таким образом можно получить неограниченное количество новых неповторяющихся изображений, подходящих под указанные характеристики.
⇡#Мобильное приложение AI Resp для определения симптомов COVID-19
Разработчик: SberMedAI.
Сайт программы: resp.sbermed.ai (доступны версии для Android и iOS).
Мобильная разработка компании SberMedAI (входит в экосистему «Сбера»), которая при помощи смартфона анализирует звуки дыхания и кашля человека на наличие паттернов, характерных для коронавируса. AI Resp использует ИИ-модель, обученную на 3000 обезличенных записей больных COVID-19 пациентов, а её точность определения заболевания, как утверждается, достигает 82%. Несмотря на столь высокий показатель, разработчики честно предупреждают, что программа не является диагностическим средством и не может заменить классические лабораторные исследования, поэтому при появлении симптомов коронавируса необходимо обратиться к врачу.
В силу того, что магазины приложений Google Play и App Store накладывают определённые ограничения на упоминание COVID-19 в названии и описании продуктов, в интерфейсе AI Resp речь идёт о респираторных заболеваниях в целом. При этом следует иметь в виду, что нейросеть программы обучена на образцах дыхания и кашля больных коронавирусом и её основным предназначением является диагностика именно этого заболевания.
⇡#Мобильное приложение AI Skin для диагностики кожных заболеваний
Разработчик: SberMedAI.
Сайт программы: skin.sbermed.ai (доступны версии для Android и iOS).
Ещё один мобильный инструмент подведомственной «Сберу» компании SberMedAI, который на основе загруженных фотографий оценивает вероятность наличия патологии из 7 распространённых типов заболеваний кожи. В основе AI Skin лежат алгоритмы искусственного интеллекта, а предоставляемые программой сведения носят исключительно рекомендательный характер и не являются медицинским заключением.
AI Skin распознаёт интраэпителиальную карциному, актинический и себорейный кератоз, базалиому, дерматофиброму, меланоцитарный невус, меланому и сосудистые высыпания на коже. Для проведения диагностики необходимо при помощи смартфона сфотографировать повреждённый участок кожи и загрузить изображение в приложение. Полученный снимок AI-движок программы сравнивает с базой из нескольких тысяч клинически подтверждённых случаев новообразований кожи и выдаёт результат в процентном соотношении. Для точной диагностики рекомендуется обратиться к врачу.
⇡#Приложение NVIDIA Canvas для генерации пейзажных изображений
Разработчик: NVIDIA.
Сайт программы: nvidia.com/studio/canvas.
Программная разработка для работы с графикой, позволяющая превращать грубые наброски в реалистичные пейзажи посредством искусственного интеллекта, обученного более чем на 5 млн изображений.
Для работы с NVIDIA Canvas не требуется ровным счётом никаких художественных навыков и умений: достаточно лишь рисовать мышью простые фигуры и линии при помощи набора кистей, имитирующих реальные текстуры — траву, облака, снег, песок, камни и др. На основе набросков приложение мгновенно создаёт изображения в соответствии с замыслом пользователя. Всего программа поддерживает наложение девяти стилей, которые меняют атмосферу изображения, и использование двадцати кистей. Полученный результат можно сохранить в виде PSD-файла для дополнительной обработки в Adobe Photoshop. Распространяется приложение бесплатно, однако для работы с ним подойдёт не каждый компьютер. В системных требованиях Canvas указаны ОС Windows 10 и видеокарты NVIDIA GeForce RTX, NVIDIA RTX, TITAN RTX с установленным драйвером версии 471.68 или более поздних выпусков.
⇡#Сервис NVIDIA Image Inpainting для умного ретуширования изображений
Разработчик: NVIDIA.
Сайт проекта: nvidia.com/research/inpainting.
Ещё одна использующая ИИ-алгоритмы разработка компании NVIDIA, выполненная в формате онлайнового сервиса и позволяющая ретушировать изображения при помощи «умной» кисти. Image Inpainting умеет восстанавливать повреждённые снимки с дефектами, может удалять лишние объекты на фотографии, дорисовывать недостающие фрагменты, а также сглаживать выделенные области. Как и в случае с упомянутой выше программой Canvas, от пользователя при работе с сервисом требуется только манипулировать кистью — все остальные операции с графикой выполняет искусственный интеллект.
⇡#Инструмент Animated Drawings для анимации детских рисунков
Разработчик: Meta✴.
Сайт сервиса: sketch.metademolab.com.
Разработка инженеров лаборатории искусственного интеллекта компании Meta✴ (ранее известной как Facebook✴), которая анимирует детские рисунки. Система анализирует изображение, создаёт примитивный «скелет» нарисованного на нём персонажа и заставляет его довольно правдоподобно двигаться.
В качестве входных данных Animated Drawings использует любой рисунок антропоморфного существа. Изображение достаточно отсканировать или сфотографировать, после чего загрузить в систему, а затем дождаться построения модели фигуры — распознавания структуры её конечностей и сочленений, на основе которых будет строиться анимация. При необходимости полученный результат можно подкорректировать вручную. После этого останется только выбрать любую из доступных схем анимации и получить на выходе готовый мультипликационный ролик, которым можно поделиться с семьёй или друзьями. По словам разработчиков, проект Animated Drawings является очередным шагом на пути к созданию искусственного интеллекта, способного видеть мир подобно человеку. В будущем создатели системы собираются рассказать о ней подробнее.
Технологии искусственного интеллекта совершенствуются бурными темпами, а машинное обучение и нейронные сети с каждым годом находят новые сферы применения в жизни человека. Цифровой прогресс неумолим, и ярким подтверждением этого факта служит наша подборка AI-решений, включающая не лабораторные прототипы, а вполне рабочие и доступные широкой аудитории продукты. Индустрия ИИ находится на пороге своего развития, и нет никаких сомнений в том, что в ближайшем будущем нас ожидают интересные новинки в данном сегменте и большие перемены на IT-рынке.