Теги → нейросеть
Быстрый переход

Продемонстрирована российская нейросистема для управления отрядами боевых роботов

Государственная корпорация Ростех продемонстрировала в рамках международного военно-технического форума «Армия-2020» передовую интеллектуальную систему управления формированиями боевых роботов.

Платформа разработана специалистами АО «Радиозавод» холдинга «Росэлектроника», входящего в Ростех. В основе системы лежат нейросети: применяются специализированные математические модели с элементами искусственного интеллекта.

Схема работы комплекса выглядит следующим образом. На первом этапе производится обнаружение цели средствами разведки — спутником, дроном или радиолокационной станцией. Затем данные об объекте поступают в мобильный пункт управления. На основе полученной информации интеллектуальная система формирует и передаёт команду средствам поражения — перспективным робототехническим комплексам. Это могут быть ракетные, реактивные или артиллерийские роботизированные платформы.

Утверждается, что применение нового решения позволит повысить эффективность боевых систем более чем в три раза за счёт минимизации участия человека в процессе управления.

«Новая автоматизированная система управления роботами может применяться при оснащении ВС РФ и других силовых ведомств в рамках создания единого информационного пространства. Разработка может использоваться в интересах МЧС для управления робототехническими комплексами пожаротушения», — отмечает Ростех. 

Facebook создала аппаратно независимую альтернативу NVIDIA DLSS

Новая статья, опубликованная исследователями Facebook перед SIGGRAPH 2020, рассказывает о технологии полноэкранного сглаживания Neural Supersampling, основанной на машинном обучении — она не слишком отличается от технологии NVIDIA Deep Learning Super Sampling (DLSS), но при этом не требует какого-либо запатентованного аппаратного или программного обеспечения.

При этом результаты работы технологии весьма впечатляют: как можно видеть на примерах изображений, качество оказывается вполне сопоставимым с DLSS. «Наиболее близкой к нашей работе является недавно представленная технология NVIDIA Deep-Learned Supersampling (DLSS), которая в реальном времени повышает качество рендеринга контента с низким разрешением с помощью нейронной сети», — сообщает описание.

Как отмечают исследователи, их метод легко интегрировать в современные игровые движки, он не требует специального оборудования (например, для отслеживание глаз) или программного обеспечения (например, специальных драйверов DLSS), что делает его применимым к более широкому спектру существующих программных платформ, аппаратных ускорителей и дисплеев.

«Мы выяснили, что для нейросуперсемплинга дополнительная вспомогательная информация, предоставляемая векторами движения, оказалась особенно эффективной. Векторы движения определяют геометрические соответствия между пикселями в последовательных кадрах. Другими словами, каждый вектор движения указывает на субпиксельное местоположение, где точка поверхности, видимая в одном кадре, могла появиться в предыдущем кадре. Эти значения обычно оцениваются методами компьютерного зрения для фотографических изображений, но такие алгоритмы оценки оптического потока подвержены ошибкам. В отличие от этого, конвейер рендеринга может непосредственно генерировать плотные векторы движения, тем самым обеспечивая надёжные и насыщенные входные данные для нейросуперсемплинга, применяемого к визуализированному контенту.

Наш метод основан на вышеупомянутых наблюдениях и объединяет дополнительную вспомогательную информацию с новым пространственно-временным дизайном нейронной сети, который нацелен на максимальное качество изображения и видео, обеспечивая при этом производительность в реальном времени.

Во время принятия решений наша нейронная сеть принимает в качестве входных данных атрибуты рендеринга (цвет, карту глубины и плотные векторы движения на каждый кадр) как текущего, так и нескольких предыдущих кадров, визуализированных с низким разрешением. На выходе нейросеть получает цветное изображение высокого разрешения, соответствующее текущему кадру. Сеть проходит контролируемое обучение: в процессе в качестве эталонного изображения выступает картинка в высоком разрешении, полученная методами полноэкранного сглаживания, — она используется в паре с каждым входным кадром низкого разрешения».

Очевидно, Facebook упомянула и о возможном применении метода Neural Supersampling в приложениях дополненной и виртуальной реальности в рамках собственной платформы Oculus. Однако нет причин, по которым подобную многообещающую альтернативу DLSS нельзя было бы применять и в обычных играх.

Студия Артемия Лебедева больше года выдавала ИИ за живого дизайнера. Никто не догадался

Студия Артемия Лебедева разработала «искусственный дизайнерский интеллект» для создания уникальных логотипов и другой айдентики. Его назвали Николай Иронов. Больше года ИИ выдавали за реального дизайнера, и заказчики не знали об этом.

Студия рассказала, что проект разрабатывался в строгой секретности и детали никому из клиентов не раскрывались. В курсе была только «изолированная команда» сотрудников. Чтобы сохранить всё в тайне, для Николая Иронова создали страницу с портфолио. Компания хотела получить объективную обратную связь без предубеждений касательно ИИ.

По словам организации, результаты превзошли все ожидания. Сейчас в портфолио нейросети участие в 17 проектах. В их числе логотип блогера Юрия Хованского, Руслана Усачева, а также кафе, пельменных и других компаний.

Логотип Юрия Хованского

Логотип Юрия Хованского

Логотип Руслана Усачева

Логотип Руслана Усачева

Логотип пельменной «Ванлав»

Логотип пельменной «Ванлав»

«Дизайнеры, даже самые смелые и прогрессивные, ориентируются на удачные работы коллег, на жюри международных премий и на собственный опыт. Искусственный дизайнерский интеллект не ориентируется ни на кого. Он открывает такие приемы, которые никогда не придумал бы ни один человек. Он способен создавать действительно новое, предлагая удивительно смелые и неожиданные идеи.

Благодаря уникальному стилю многие из логотипов стали суперпопулярными и получили огромный охват — их массово обсуждали в интернете, о них писали СМИ и крупные сообщества», — заявили в студии.

Все работы нейросети сделаны по программе экспресс-дизайна, где любой желающий может заказать логотип за 100 тысяч рублей. Особенностью программы является то, что результат не обсуждается.

Новая нейросеть NVIDIA воссоздала игру Pac-Man за 4 дня

Pac-Man появилась на аркадных автоматах 22 мая 1980 года. На разработку игры ушло целых 17 месяцев — ни один проект прежде не требовал столько времени. Ровно 40 лет спустя компания NVIDIA представила нейросеть GameGAN, которая смогла воссоздать всю игру Pac-Man всего за 4 дня.

GameGAN — это игровая генеративно-состязательная сеть (Generative Adversarial Network, GAN), подобная тем, которые используются для создания фотореалистичных изображений несуществующих людей.

В общем понимании GAN состоит из двух нейросетей — генерирующей и дискриминативной. Генерирующую сеть обучают с использованием больших наборов данных, а затем ставят перед ней задачу — создать или воссоздать какое-то изображение на основе полученной информации. Дискриминирующая нейросеть сравнивает результат работы первой сети с тем, что содержится в базе данных, а затем определяет, насколько точным получился этот результат. Совместная цикличная работа обеих нейросетей способна приводить к созданию всё более и более реалистичных изображений.

В случае с GameGAN компания NVIDIA обучила генеративную нейросеть с помощью 50 тыс. игровых сессий в Pac-Man. Затем перед ней поставили задачу — воссоздать увиденную игру целиком, начиная от статичных стен и точек и заканчивая двигающимися призраками и самим Пакманом. Обучение и воссоздание игры проводилось с использованием квартета графических ускорителей NVIDIA Quadro GP100.

Самое интересное заключается в том, что GameGAN не предоставили доступ к оригинальному коду игры или её движку. Всё обучение сводилось к тому, что одна нейросеть наблюдала за тем, как в Pac-Man играла другая нейросеть.

«За последние годы было создано множество ИИ, способных играть в игры. Но они лишь агенты в этих играх. Наша GAN способна воспроизводить игры фактически из ничего», — прокомментировал Рев Лебаредян (Rev Lebaredian), вице-президент NVIDIA по вопросам технологий симуляции.

Создателем GameGAN является специалист NVIDIA Сын-Вук Ким (Seung-Wook Kim)

Создателем GameGAN является специалист NVIDIA Сён-Вук Ким (Seung-Wook Kim)

Как указано в блоге компании, одна нейросеть выступает в качестве агента (игрока), GameGAN в свою очередь реагирует на действия первой нейронной сети и покадрово создаёт новое игровое окружение в реальном времени. Более того, на основе изображений из игр с многоуровневой структурой GameGAN способна генерировать новые игровые уровни, которые она никогда не видела раньше.

Это чем-то похоже на методы процедурной генерации, которые использовались ещё с конца 70-х годов.

«Для создания игры, подобной Pac-Man, программисту требуется придумать и прописать правила поведения и взаимодействия всех имеющихся агентов внутри игры. Это очень кропотливая работа. GAN может упростить эту задачу. Нейросеть способна обучаться новым правилам через наблюдение. В идеале алгоритмы, подобные GameGAN, можно будет обучить процедурной генерации правил для той игры, которую вы хотите создать», — пояснил Лебаредян.

Процесс обучения при этом будет таким же простым, как, скажем, установка видеорегистратора в автомобиль с последующей поездкой по городу. Аналог GameGAN сможет обучаться по записанным видео и процедурно генерировать реалистичные уровни на основе того, что покажет камера.

В перспективе подобный метод также сможет ускорить подготовку автоматизированных машин. Использующиеся на тех же складах и сборочных линиях роботы могут представлять опасность для работающих там людей. Поэтому перед запуском в работу эти машины проходят виртуальную подготовку с применением различных сценариев, что в итоге минимизирует возможные риски. Проблема в том, что разработка всех этих обучающих сценариев отнимает большое количество ресурсов и времени. Вполне возможно, что однажды будет создана модель глубокого машинного обучения, с помощью которой можно будет предсказывать те или иные последствия в различных сценариях. Но пока этого нет.

«В конечном итоге мы создадим ИИ, который сможет имитировать правила вождения или законы физики, просто наблюдая за тем, как действуют агенты в этих средах. GameGAN — первый шаг к этому», — добавил Санья Фидлер (Sanja Fidler), директор исследовательской лаборатории NVIDIA в Торонто.

Полноценную версию Pac-Man, созданную нейросетью GameGAN, NVIDIA собирается опубликовать в Сети этим летом.

Нейросеть научили убедительно имитировать человеческие эмоции голосом

Британская компания Sonantic разработала нейросеть, способную убедительно имитировать «глубокие человеческие эмоции» во время озвучивания текста, например, плакать или вздыхать. В этом плане она на несколько порядков превосходит возможности тех же голосовых помощников Siri или Alexa, которых вряд ли можно назвать эмоциональными или выразительными.

Созданная компанией Sonantic программа для редактирования звуковой информации использует множество различных голосовых моделей, созданных на основе голосов живых актеров. Компания продемонстрировала результаты своей работы в опубликованном видео. Все голоса, которые можно услышать в диалоге в начале ролика, сгенерированы компьютерным алгоритмом, который играет роль расстающихся матери и дочери.

В апреле компания привлекла 2,3 млн евро инвестиций и в настоящий момент сотрудничает с рядом производителей игр. Последним приходится часто записывать тысячи строк диалогов для дальнейшей озвучки. Использование аудиоредатора Sonantic в свою очередь позволит удешевить и ускорить разработку игр. Программа сможет менять голос под различные игровые обстоятельства, — например, если персонаж говорит во время бега — и не терять «естественность», когда по сценарию нужно заплакать или закричать.

Разработчики не считают, что их технология полностью вытеснит актеров озвучки. Скорее, она должна стать тем, чем в своё время стала компьютерная (CGI) графика для производства фильмов. Специалисты Sonantic говорят, что их технология позволит рассказать новые истории фантастическим образом.

Штрафы за разговоры по телефону за рулем автомобиля будут выносить специальные камеры, Big Data и нейросети

По сообщениям сетевых источников, ГИБДД РФ планирует использовать на дорогах специальные камеры, способные фиксировать использование водителями телефонов во время движения. Соответствующее программное обеспечение, построенное на основе нейронных сетей, в настоящее время тестируется и в скором времени начнёт применяться на территории Москвы. Об этом сообщает издание Коммерсантъ со ссылкой на заместителя начальника ГИБДД России Александра Быкова.

Комментируя данный вопрос, господин Быков подтвердил, что ГИБДД Москвы рассматривает возможность использования на дорогах города камер, способных определять, когда водитель разговаривает по телефону. Он также отметил, что о массовом применении таких средств речь не идёт, поскольку производитель должен провести все необходимые испытания и получить соответствующие сертификаты. Если вся необходимая документация будет получена, то система начнёт использоваться в тестовом режиме. Одним из важных моментов является проверка работоспособности алгоритмов на фиксацию и обработку ложных срабатываний.

Предполагается, что проект ГИБДД будет реализовываться с использованием нового прибора корпорации «Строй Инвест Проект», которая является разработчиком камер «Стрелка», «Стрелка плюс», «Блокпост стрелка» и др. Испытания устройства проводились в феврале этого года специалистами Центра организации дорожного движения Москвы совместно с управлением ГИБДД.

«Суть технологии заключается в том, что нейросеть с помощью Big Data научилась точно определять, держит ли водитель телефон у уха, или, например, пристёгнут ли он ремнём безопасности», — прокомментировал данный вопрос источник издания, знакомый с проектом ГИБДД.     

Напомним, запрет на использование телефонов за рулём без устройства hands-free в России введён в ПДД в 2001 году, а с 2013 года за такие нарушения предусматривается штраф в размере 1500 рублей. По итогам прошлого года в стране было выписано более 84 000 штрафов водителям, разговаривавшим по телефону во время езды.

C помощью нейросетей съёмка Нью-Йорка 1911 года превращена в цветное видео 4k/60p

В 1911 году шведская компания Svenska Biografteatern сделала видеозапись поездки в Нью-Йорк, в результате чего было получено более восьми минут видео, которое в своём первоначальном виде имеет довольно слабое разрешение и низкую нестабильную частоту кадров.

В течение ряда лет предпринимались различные попытки улучшить разрешение, частоту кадров, цвета и другие детали. Результаты получались разные, но одним из лучших на сегодня стала работа Дениса Ширяева (Denis Shiryaev), который недавно поделился улучшенным видео на Reddit и своём канале YouTube.

Видео Нью-Йорка 1911 года в 4K/60p

Согласно описанию видео, а также комментарию, оставленному Ширяевым в Reddit, в проекте были задействованы четыре нейронные сети, включая DeOldify NN (для колоризации). В целом, различным нейронным сетям удалось увеличить частоту кадров до 60 в секунду, поднять разрешение до 4K, повысить резкость и даже провести автоматическое оцветнение.

Исходное видео Нью-Йорка 1911 года с наложением озвучки и откорректированной скоростью воспроизведения

Результат куда лучше оригинала, однако с автоматическим оцветнением нейросеть явно не справилась. Наложенные звуки позволяют глубже погрузиться в атмосферу деловой столицы США более чем 100-летней давности. Мы уже писали о том, как Денис Ширяев визуально улучшил знаменитую короткометражку братьев Люмьер «Прибытие поезда» 1896 года. На его канале есть и другие любопытные работы, включая лунную миссию «Аполлона-16»:

Alphabet представил сервис для выявления фейковых фотографий

Компания Jigsaw, принадлежащая холдингу Alphabet, объявила о создании инструмента для выявления поддельных фотографий. Новый сервис поможет выявить следы редактирования фотографий, даже если они были созданы с помощью искусственного интеллекта.

Проект получил название Assembler и был разработан учёными из Калифорнийского университета Беркли и Неаполитанского университета в Италии. По словам разработчиков, он может упростить борьбу с дезинформаций. Экспериментальная платформа состоит из семи «детекторов», работающих на основе самообучаемых нейросетей. Пять детекторов определяют слияние фотографий или дублирование объектов. Два других предназначены для идентификации дипфейков.

«Эти детекторы не смогут полностью решить проблему, но они представляют собой важный инструмент для борьбы с дезинформацией», — сказала Луиза Вердолива (Luisa Verdoliva), профессор Неаполитанского университета.

Как отмечает Сантьяго Андриго (Santiago Andrigo), менеджер по продукции Jigsaw, Assembler будет наиболее важен для журналистов крупных новостных агентств, поскольку способствует проверке на подлинность скандальных изображений. Сообщается, что бесплатный инструмент уже тестируется в некоторых общественных организациях и СМИ, широкой общественности сервис доступен не будет.

«Прибытие поезда» братьев Люмьер и «Чебурашку» улучшили с помощью нейросетей

Использование нейронных сетей для улучшения качества изображения в классических кинолентах становится всё более популярным. На этот раз передовые технологии использовались для визуального улучшения знаменитой короткометражки братьев Люмьер «Прибытие поезда», а также советского мультфильма «Чебурашка».

Обновлённый вариант фильма «Прибытие поезда», который был снят братьями Люмьер в далёком 1896 году, выложил на YouTube менеджер по продукту издательского дома «Комитет» Денис Ширяев. Обработка ролика заняла у него два дня. Сначала использовался алгоритм Dain, с помощью которого был сделан покадровый разбор ленты. Полученные таким образом порядка 4000 файлов обрабатывались программой Gigapixel AI, за счёт чего качество кадров было значительно улучшено. Кадры в формате 4К использовались для создания обновлённого фильма. В конечном счёте удалось создать ролик в формате 4К с частотой 60 кадров в секунду. Автор отмечает, что сложнее всего было подогнать скорость видео. Приходилось ориентироваться на то, как передвигаются люди в кадре, чтобы достигнуть оптимального результата.

О другом подобном проекте стало известно в конце января. Ведущий подкаста Zavtracast Максим Зарецкий использовал нейронную сеть для увеличения частоты кадров в советском мультипликационном фильме «Чебурашка», который был снят в 1971 году. Он задействовал алгоритм DAIN AI (децентрализованная система, осуществляющая вычисления за счёт одновременного использования большого количества компьютеров), благодаря чему, частота увеличилась с 7-8 кадров в секунду до 50 кадров в секунду.

Генерация ролика осуществлялась с помощью бесплатной нейросети DAIN APP, способной осуществлять интерпретацию новых кадров с последующей генерацией большей кадровой частоты, чем была в оригинале.

Snapchat тестирует легальный аналог дипфейков — замену лиц на видео

В Snapchat появилась новая тестовая возможность, которая позволяет заменять лица людей на видео на внешность пользователей. Это своего рода упрощённый вариант Deepfake в GIF-анимации. Новинка называется Cameo и является расширением и одновременно альтернативой Bitmoji.

techcrunch.com

techcrunch.com

Некоторые французские пользователи получили доступ к тестовой версии Cameo, а в самом Snapchat подтвердили факт тестирования. В компании заявили, что новинка пока не готова, потому её «гоняют» лишь в некоторых регионах. Однако в ближайшее время ожидается полномасштабный запуск. По последним данным, функцию запустят для всех уже 18 декабря на iOS и Android.

На данный момент, как сообщается, доступны 150 коротких циклических видеоклипов со звуком, из которых можно выбрать то, что понравится. К примеру, там есть персонажи «Мстителей» и других фильмов Marvel. Есть даже сам Стэн Ли.

Для использования функции надо сделать селфи, затем выбрать мужское или женское телосложение. После этого программа добавит лицо пользователя к ролику. При этом отмечается, что менять допускается только безобидные видео. Записи выступления политиков, порно и другие материалы «повышенной опасности» изменить с помощью Snapchat не получится.

techcrunch.com

techcrunch.com

Следует отметить, что подобное уже есть в китайском приложении Zao, однако пока неясно, станет ли нововведение причиной судебного разбирательства. Ясно лишь одно — дипфейки завоёвывают мир. И не только в последнем обновлении Plague Inc.

MIT и Ford представили новый метод навигации для роботов-курьеров

Инженеры из Массачусетского технологического института (MIT) и Ford Motor разработали новый метод ориентирования для роботов-доставщиков. Благодаря новому методу навигации роботы во время движения ориентируются по специальным подсказкам на местности без помощи GPS.

Так называемые «подсказки» фактически могут представлять собой почти всё что угодно, например входную дверь, тротуар, гараж и прочие объекты. Для получения визуальной информации роботов оснастили специальными камерами, которые с помощью искусственного интеллекта отмечают различные объекты, создавая себе подсказки. Затем нейросеть на основе имеющихся подсказок строит карту и соответственно маршрут, по которому робот двигается в точку прибытия.

«Даже если робот доставляет посылку туда, где раньше никогда не был, ранее добавленные подсказки помогут ему ориентироваться, ведь даже в незнакомом месте могут быть такие же объекты, которые он видел в других местах» — заявил Майкл Эверетт (Michael Everett), аспирант кафедры машиностроения Массачусетского технологического института.

Программа использует уже существующие алгоритмы, которые обрабатывают входящие визуальные образы и разбивают их на семантические подсказки, а уже после используются для построения карт и позволяют искать самый эффективный путь к месту назначения.

В России запустили облачный сервис распознавания лиц в кофейнях

В двух сетях кофеен «Правда Кофе» и OneBucksCoffee, которые расположены в Москве, началось тестирование облачного сервиса распознавания лиц Ivideon Faces для изучения привычек аудитории. Сообщается, что технология позволяет формировать списки посетителей и способна определить, новый перед ней клиент или постоянный, распознать его возраст и пол, а также искать конкретных людей в архиве и формировать детальные отчеты об аудитории.

Ivideon отмечает, что до применения облачного решения для использования систем распознавания лиц был необходим сервер и специальное ПО. Облачный вариант позволит бизнесу не тратиться на дорогостоящее оборудование. Кроме того, доступ к аналитике можно будет получить с любого устройства в любой точке планеты, где есть интернет.

«Существующие решения для распознавания лиц от других вендоров требуют установки локального дорогостоящего и сложного оборудования. Перенос технологии в облако избавит бизнес от необходимости покупать новое специализированное оборудование и даст доступ к аналитике с любого устройства по всему миру при наличии доступа в интернет», - пояснили в пресс-службе «Роснано».

На своём сайте Ivideon сообщает, что уже девять лет занимается разработкой систем облачного видеонаблюдения и видеоаналитики для дома и бизнеса. Ivideon Faces стоит от 3150 рублей в месяц за одну камеру. Стоимость зависит от глубины облачного архива и количества уникальных распознаваемых лиц. Под потребности бизнеса могут быть сформированы персональные условия.

В китайских аэропортах начали использовать технологию распознавания эмоций

Китайские специалисты разработали технологию распознавания эмоций людей, которая уже применяется в аэропортах страны и на станциях метро для выявления личности подозреваемых в преступлениях. Об этом сообщила британская газета Financial Times, которая отмечает, что над созданием подобной системы работает целый ряд компаний по всему, в том числе Amazon, Microsoft и Google.

Основой новой технологии стала нейросеть, которая долгое время обучалась наблюдать за малейшими эмоциональными изменениями человека. Со временем она научилась обнаруживать в толпе асоциальных или же просто опасных людей, после чего передавать информацию о них правоохранителям.

«С помощью видеозаписи технология распознавания эмоций может быстро идентифицировать подозреваемых в преступлении, анализируя их психическое состояние, это позволяет предотвращать незаконные действия, включая терроризм и контрабанду», - цитирует газета эксперта по общественному порядку Ли Сяоюя (Li Xiaoyu) в Синьцзян-Уйгурском автономном районе. По словам эксперта, данная разработка может распознавать признаки агрессии, а также анализирует уровень стресса и готовность человека нападать на других.

«Мы работаем с самыми различными компаниями в Синьцзян-Уйгурском автономном районе, включая Hikvision, Uniview, Dahua и Tiandy, - продолжил эксперт. Только компании, которые преуспели в сфере искусственного интеллекта, могут действительно добиться успеха в данной области».

«Одноклассники» внедрили нейросеть для размытия фона во время видеозвонков

«Одноклассники» стали первой российской соцсетью, внедрившей функцию размытия фона во время видеозвонков в мобильных приложениях для операционных систем Android и iOS.

Новый инструмент позволяет скрывать детали окружающего пространства. Таким образом, пользователи смогут не беспокоиться о возможном беспорядке на заднем плане или окружении, которое не соответствует тематике разговора.

В основе работы новой системы лежат алгоритмы машинного обучения и нейросети с семантической сегментацией объектов на картинке. Важно отметить, что соответствующие технологии являются собственной разработкой «Одноклассников».

Размытие фона доступно как во время групповых видеозвонков, так и во время звонков в режиме «один на один».  Система отделяет звонящего человека от заднего плана, скрывая лишние детали.

Новую функцию можно включить во время видеозвонка, через кнопку в настройках одним кликом, и при необходимости отключить этим же способом.

Добавим, что ранее похожую технологию внедрила корпорация Microsoft, правда, пока только для десктоп-клиента в корпоративном мессенджере Teams App и в Skype. 

Нейросеть «Beeline AI - Поиск людей» поможет найти пропавших

«Билайн» разработал специализированную нейронную сеть, которая поможет в поиске пропавших: платформа получила название «Beeline AI - Поиск людей».

Решение призвано упростить работу поисково-спасательного отряда «Лиза Алерт». С 2018 года эта команда применяет беспилотные летательные аппараты для поисковых операций, проводимых в лесу и на промышленных территориях городов. Однако анализ снимков, получаемых с камер дронов, требует вовлечения большого количества волонтеров. К тому же на это уходит очень много времени.

Нейросеть «Beeline AI - Поиск людей» как раз и призвана автоматизировать процесс обработки фотографий. Утверждается, что специализированные алгоритмы позволяют сократить время на просмотр и сортировку полученных снимков в два с половиной раза.

Платформа использует технологии свёрточных нейронных сетей, что повышает эффективность работы средств машинного зрения. Обучение нейросети проходило на реальных подборках изображений. Испытания показали, что точность модели на тестовых изображениях приближается к 98 %.

Первостепенной задачей «Beeline AI - Поиск людей» является сортировка «пустых» и неинформативных фотографий, на которых точно нет человека или атрибутов, указывающих, что в этом месте был человек. Это позволяет группе анализа сразу сосредоточиться на потенциально результативных снимках.

Система может адаптироваться к различным условиям. Она одинаково точно находит объекты как с высот 30–40 метров, так и с высоты полёта 100 метров. При этом нейросеть способна обрабатывать изображения с высоким уровнем визуального «шума» — деревья, природный ландшафт, сумерки и т. д.

«Потенциально нейронная сеть способна находить людей и предметы во всех местах поиска, таких как лес, болота, поля, города, независимо от времени года и одежды человека, так как алгоритм настраивается на работу в любое время года и потенциально сможет распознавать нестандартное положение тела в пространстве, например, сидящего, лежащего или частично укрытого листвой человека», — отмечает «Билайн». 

window-new
Soft
Hard
Тренды 🔥