Теги → нейроны
Быстрый переход

ИИ научился создавать уникальные логотипы в высоком разрешении

Генеративные состязательные сети (Generative adversarial network — GAN) — это нейронные сети, состоящие из двух частей: генераторов, которые создают образцы на основе ранее изученной выборки данных, и дискриминаторов, которые пытаются отличить их от аналогов из реального мира или просто вынести вердикт, убедителен результат работы генератора или нет. Ранее предпринимались попытки использовать их для самых разных задач: от обнаружения новых лекарств до создания убедительных фотографий гамбургеров и бабочек, и генерирования правдоподобных результатов сканирования мозга человека. Учёные из Маастрихтского университета в Нидерландах ещё в прошлом году нашли для них ещё одно применение, продемонстрировав, что они не так уж и плохи в генерации логотипов, а их новая публикация развивает данную идею, демонстрируя, что удалось добиться учёным за год работы, например, лучшее разрешение и детализацию получающихся изображений.

Нейронная сеть созданная учёными из Маастрихтского университета в Нидерландах самостоятельно создаёт детализированные логотипы в высоком разрешении

Нейронная сеть, созданная учёными из Маастрихтского университета в Нидерландах, самостоятельно создаёт детализированные логотипы в высоком разрешении

Новая нейронная сеть создана на базе уже разработанной ими ранее системе машинного обучения для создания логотипов — LoGAN, которую они подробно описывали в исследовании, опубликованном в октябре прошлого года. LoGAN умеет создавать логотипы лишь в одной из двенадцати заложенных в него возможных цветовых гамм в разрешении 32 на 32 пикселя, что, согласитесь, достаточно далеко до реального использования на рынке, хотя и достаточно неплохо, если бы речь шла о генерации иконок. Новая же модель способна создавать логотипы с гораздо большим разрешением и детализацией.

По сравнению с прошлой версией заметен явный прогресс. Предыдущая версия системы была ограничена как в разрешении, так и в цветовой гамме

Предыдущая версия модели была ограничена как в разрешении, так и в цветовой гамме

«Поскольку большинство американцев видят от 4000 до 20000 рекламных объявлений в день, компании уделяют всё больше внимания своему брендингу. Это вынуждает дизайнеров постоянно придумывать новые эстетичные и одновременно с этим инновационные и уникальные решения, в попытке выделить их продукт из массы», — пишут соавторы работы. «Искусственный интеллект может помочь дизайнерам, дав им некоторое вдохновение или сократив количество доработок, с которыми сталкиваются их клиенты».

Модель способна группировать полученные логотипы по определённым наборам признаков

Модель способна группировать полученные логотипы по определённым наборам признаков

Для обучения нейронной сети учёные использовали как изображения с более низким разрешением, так и с более высоким. Они утверждают, что поскольку изображения с низким разрешением содержали меньше деталей, система смогла быстро освоить базовые шаблоны работы и перейти от грубых набросков к созданию логотипов с большей детализацией.

Чтобы собрать набор обучающих данных, исследователи сначала подготовили базу данных, содержащую более 120 000 уникальных логотипов в разрешении 400 на 400 пикселей, полученных из Twitter. Затем они исключили из неё все текстовые логотипы, оставив в общей сложности 40 000 образцов. После этого они их дополнили 15 000 «похожих на логотип» изображений из Google, относящихся к природе, технологиям, графическим символам и т. п. И под конец использовали службу Cloud Vision от Google для разметки данных, чтобы каждый образец получил описание, состоящее из от четырёх до восьми слов. Полученные данные они векторизовали с использованием предварительно обученной модели ИИ для создания пространственных представлений, которые затем были сгруппированы по степени похожесть визуальных характеристик.

В ходе трёх испытаний исследователи доказали, что их модель стабильно генерирует логотипы «неизменно высокого качества». Некоторые из них были более простыми, чем другие, по форме, дизайну или цветовой палитре, но команда уверена, что разнообразие результатов указывает на то, что их модель можно обучать и далее на более сложных наборах данных, что ещё больше повысит качество её работы.

Стоит отметить, что использование искусственного интеллекта для создания логотипов совсем не новая идея. Например, канадский стартап Looka (ранее Logojoy) уже несколько лет предлагает своё решение с использованием ИИ, которые может помочь вам получить уникальный логотип буквально за 5 минут на базе указанных вами параметров (общей стилистики, цветовой гаммы, подходящих символов, названия компании).

Компания PROMT представила новое флагманское решение на основе нейронных сетей

Представители компании PROMT провели презентацию флагманского продукта, представляющего собой клиент-серверное решение для корпоративных пользователей, основой для которого стали нейронные сети. Новинка под названием PROMT Neural Translator Server была представлена в Аналитическом центре при правительстве РФ.   

С помощью новой системы можно получать перевод корпоративной и технической документации, а также пользовательского контента. Решение базируется на технологии PROMT Neural, которая объединила в себе перевод на основе правил и машинное обучение с применением рекуррентных нейронных сетей. Объединение технологий позволяет получать точно переведённый текст, который практически неотличим от перевода, который мог бы сделать человек.

Ещё одна особенность системы заключается в поддержке обучения на основе материалов заказчиков. Решение может запоминать узкоспециализированную терминологию и стиль текстов, используя эти данные для дальнейшего обучения. После этапа обучения система способна с высокой точностью переводить разные материалы, в том числе документацию, деловую или личную переписку, презентации и др.

Стоит отметить, что PROMT Neural Translator Server может одинаково эффективно работать как на Linux, так и на Windows-серверах. Разработчик гарантирует конфиденциальность переводимой информации и защиту от утечек. Это достигается путём интеграции решения PROMT в корпоративную сеть заказчика, благодаря чему переводы текстов могут осуществляться без подключения к сети Интернет.  

Система PROMT Neural Translator Server объединяет в себе современные технологии перевода, построенные на работе нейронных сетей, с возможностью полноценного функционирования внутри закрытых корпоративных сетей. Всё это делает представленное решение уникальным на российском и мировых рынках.  

OpenAI обучает ИИ командной работе в игре в прятки

Старая добрая игра в прятки может стать прекрасным испытанием для ботов с искусственным интеллектом (ИИ), позволяющим продемонстрировать, как они принимают решения и взаимодействуют, как друг с другом, так с различными окружающими объектами.

В своей новой статье, опубликованной исследователями из некоммерческой организации OpenAI, занимающейся исследованиями в области искусственного интеллекта и прославившейся победой над чемпионами мира в компьютерной игре Dota 2, учёные описывают как агенты, контролируемые искусственным интеллектом, обучались как изощрённее искать и прятаться друг от друга в виртуальной среде. Результаты исследования продемонстрировали, что команда из двух ботов обучается эффективнее и быстрее, чем любой отдельный агент без союзников.

В своей новой работе исследователи из OpenAI продемонстрировали как искусственный интеллект может обучаться намного эффективнее и использовать объекты окружения в команде, играя в прятки друг против друга

В своей новой работе исследователи из OpenAI продемонстрировали, что искусственный интеллект может обучаться намного эффективнее и быстрее в группах из несколько агентов на примере игры в прятки

Учёные использовали уже давно завоевавший свою славу метод машинного обучения с подкреплением, в котором искусственный интеллект помещается в неизвестную ему среду, имея при этом определённые способы взаимодействия с ней, а также систему наград и штрафов за тот или иной результат своих действий. Данный метод достаточно эффективен благодаря возможностям ИИ выполнять различные действия в виртуальной среде с огромной скоростью, в миллионы раз быстрее, чем может представить человек. Это позволяет методом проб и ошибок найти наиболее эффективные стратегии для решения поставленной задачи. Но у данного подхода также есть некоторые ограничения, например, создание среды и проведение многочисленных циклов обучения требует огромных вычислительных ресурсов, а сам процесс нуждается в точной системе сопоставления результатов действий ИИ с поставленной ему целью. Кроме того, приобретенные агентом таким образом навыки ограничены описанной задачей и, как только ИИ научится с нею справляться, никаких улучшений большей уже не будет.

Для обучения ИИ игре в прятки учёные использовали подход, называющийся «ненаправленное исследование» (Undirected exploration), который заключается в том, что агенты имеют полную свободу действий для развития своего понимания игрового мира и разработки выигрышных стратегий. Это похоже на подход к многоагентному обучению, который применяли исследователи из DeepMind, когда несколько систем искусственного интеллекта были обучены играть в режиме «захват флага» в игре Quake III Arena. Как и в этом случае, агенты ИИ не были заранее обучены правилам игры, но со временем они выучили базовые стратегии и даже смогли удивить исследователей нетривиальным решениями.

При игре в прятки нескольким агентам, чьей задачей было прятаться, было необходимо избегать прямой линии видимости соперников после небольшой форы во времени, пока команда ищущих агентов была обездвижена. При этом «линия видимости» в данном контексте представляет собой конус в 135 градусов перед отдельным ботом. Агенты не могли удаляться слишком далеко за пределы игровой площадки и были вынуждены перемещаться по случайно сгенерированным комнатам с возможностью использовать некоторые внешние объекты (ящики, передвижные стены, специальные пандусы), разбросанные вокруг, которые можно было использовать как для создания укрытий, так и для проникновения в них.

ИИ выработал шесть стратегий игры, которые последовательно сменяли друг друга по мере обучения и совершенствования противников относительно друг друга

ИИ выработали шесть стратегий игры, которые последовательно сменяли друг друга по мере обучения и совершенствования противников относительно друг друга

В результате долгого процесса обучения ИИ-агенты освоили шесть уникальных стратегий, каждая из которых помогала им переходить к следующему этапу игры. Вначале команды ищущих и прячущихся просто убегали и преследовали друг друга, но после примерно 25 миллионов матчей команда прячущихся научилась блокировать проходы коробками и строить из них укрытия. После ещё 75 миллионов матчей команда ищущих обнаружила способы использовать пандусы, чтобы проникать в эти укрытия. Спустя ещё 10 миллионов раундов прячущиеся научились оттаскивать пандусы к краю игровой площадки и фиксировать их на месте, чтобы не позволить противникам использовать их.

После 388 миллионов матчей ищущая команда научилась использовать специальные пандусы, чтобы проникать в укрытия противника

После 88 миллионов матчей ищущая команда научилась использовать специальные пандусы, чтобы проникать в укрытия противника

После 388 миллионов матчей ищущие научились использовать заблокированные пандусы, чтобы подняться на принесённые к ним ящики, а затем, перемещаясь прямо на них, проникать в созданные из переносных стен укрытия противников. И, наконец, после 458 миллионов матчей прячущаяся команда сделала вывод, что нужно заблокировать вообще все объекты, а затем построить укрытие, что и привело, по всей видимости, к её окончательной победе.

Что особенно впечатляет, так это то, что уже после 22 миллиона матчей агенты научились координировать свои действия и в дальнейшем эффективность их совместной работы только увеличивалась, например, каждый приносил свой ящик или стенку для создания укрытия и выбирал свою долю объектов для блокировки, чтобы усложнить игру противникам.

Механика игры позволила красной стороне (ищущим) через некоторое время придумать, как использовать заблокированные пандусы, чтобы подняться на коробки и перемещаться уже прямо на них, чтобы затем спрыгивать в построенные синими (прячущимися) укрытия

Механика игры позволила красной стороне (ищущим) спустя 388 миллионов матчей придумать, как использовать заблокированные пандусы, чтобы подняться на коробки и перемещаться уже прямо на них, чтобы затем спрыгивать в построенные синими (прячущимися) укрытия

Учёные также отметили важный момент, связанный с влиянием количества тренировочных объектов (объёмом пропускаемой через нейронную сеть данных — «Batch Size») на скорость обучения. Для модели по умолчанию требовалось 132,3 миллиона матчей в течение 34 часов обучения, чтобы достичь фазы на которой прячущаяся команда научилась блокировать пандусы, в то время как больший больший объём данных привёл к заметному сокращению времени обучения. Например, увеличение количества параметров (части данных, полученных в течении всего процесса обучения) с 0,5 млн до 5,8 млн повысило эффективность выборки в 2,2 раза, а увеличение размера входных данных в с 64 Кбайт до 128 Кбайт сократило время обучения почти в полтора раза.

Увеличение тренировочных объектов и входных данных позволило значительно сократить время обучения агентов

Увеличение тренировочных объектов и входных данных позволило значительно сократить время обучения агентов

В конце своей работы исследователи решили проверить, насколько обучение в игре может помочь агентам справляться со схожими задачами вне игры. Всего тестов было пять: осознание количества объектов (понимание, что объект продолжает существовать, даже если он находится вне видимости и не используется); «заблокировать и вернуться» — способность запомнить своё изначальное положение и вернуться к нему после выполнения какой-либо дополнительной задачи; «последовательная блокировка» — 4 ящика случайным образом были расположены в трёх комнатах без дверей, но с пандусами для попадания внутрь, агентам необходимо было найти и заблокировать их все; размещение ящиков на заранее заданных площадках; создание укрытия вокруг объекта в виде цилиндра.

В результате в трёх из пяти заданий боты, прошедшие предварительную подготовку в игре, обучались быстрее и показали лучший результат, чем ИИ, который обучался решению задач с нуля. Они немного лучше справились с выполнением задачи и возвратом на начальную позицию, последовательной блокировкой ящиков в закрытых комнатах и с размещением ящиков на заданных площадках, но показали немного более слабый результат при осознании количества объектов и созданию укрытия вокруг другого объекта.

Исследователи объясняют неоднозначный результаты в том, как ИИ получает и запоминает определённые навыки. «Мы думаем, что задачи, в которых предварительная подготовка в игре показала лучший результат, связаны с повторным использованием ранее изученных навыков привычным образом, в то время как для выполнения оставшихся задач лучше, чем обученный с нуля ИИ, потребуется использование их другим образом, что намного сложнее», — пишут соавторы работы. «Этот результат подчёркивает необходимость разработки методов эффективного повторного использования навыков полученных в результате обучения при переносе их из одной среды в другую».

Проделанная работа действительно впечатляет, так как перспектива использования данного метода обучения лежит далеко за пределом каких-либо игр. Исследователи утверждают, что их работа является значительным шагом к созданию ИИ с «физически обоснованным» и «человеческим» поведением, который сможет диагностировать заболевания, предсказывать структуры сложных белковых молекул и анализировать компьютерную томографию.

На видео ниже вы можете наглядно увидеть, как проходил весь процесс обучения, как ИИ учился командной работе, а его стратегии становились всё более хитрыми и сложными.

Выдачей кредитов в Сбербанке займётся искусственный интеллект

Александр Ведяхин, первый заместитель председателя правления Сбербанка, заявил что искусственный интеллект (ИИ) к концу 2020 года сможет принимать решения о выдаче кредитов без помощи сотрудников финансовой организации. В настоящий момент ИИ уже выдаёт 100 % кредитных карт, более 90 % потребительских кредитов и свыше 50 % ипотечных кредитов.

Фото: © РИА Новости / Алексей Сухоруков

Фото: РИА Новости / Алексей Сухоруков

Юридические лица могут получить от ИИ ссуду в размере не более 2 млрд рублей. В этом случае он проверит клиента и примет решение за 7 минут. Без участия нейросети такая процедура занимает 3-4 недели.

А вот принимать решение об ипотеке сложно не только тем, кто хочет взять её, но и искусственному интеллекту, поэтому пока это происходит только в половине случаев. Так что специалисты всё ещё дорабатывают этот механизм. Однако, по словам зампреда, все подразделения Сбербанка в целом готовы к переходу на ИИ: «Мы внедряем эту технологию везде, начиная с фронт-офиса, – яркий пример тому недавнее обновление нашего мобильного приложения, которое сделало каждый "Сбербанк Онлайн" уникальным и не похожим на другой, – и заканчивая бэк-офисом, где искусственный интеллект принимает решения по рутинным операциям».

Сообщается, что Сбербанк отвечает за разработку шестилетнего федерального проекта по внедрению ИИ по всей России с бюджетом в 90 млрд рублей. С внедрением ИИ некоторые специалисты оказываются не у дел, многим из них банк дает возможность остаться в команде.

«Яркий пример: при выдаче кредита у нас задействованы андеррайтеры — это люди, которые составляют мнение рисков, функцию риск-менеджмента относительно заявки на кредит. Очевидно, что при такой скорости и технологиях потребность в этих людях становится все меньше. И теперь нашим коллегам — они очень высококвалифицированные — мы предлагаем стать дата-сайентистами, то есть людьми, которые сами пишут программы искусственному интеллекту», – объясняет Ведяхин.

В 2018 году глава Сбербанка Герман Греф рассказал, что компания сократила 70 % менеджеров среднего звена.

 

Учёные всё ближе к созданию полностью оптических нейронных сетей

Нейронные сети лучше всего справляются с такими сложными задачами, как распознавание лиц и голоса, но их реализации на базе классических электросхем крайне ограничены в быстродействии и имеют очень высокое энергопотребление. Теоретически оптика может решить эти проблемы, а также превзойти электронные аналоги в матричных вычислениях, широко применяемых в нейронных сетях. Тем не менее, её применение было ограничено из-за неспособности выполнять некоторые сложные вычисления, но сейчас новые эксперименты показали, что полностью оптические нейронные сети всё-таки могут справиться с этими задачами, а значит появление новых сверхбыстрых оптических систем искусственного интеллекта в ближайшем будущем становится вполне реальным.

Оптически нейронные сети во многом превосходят электронные, а потому учёные крайне заинтересованны разработать их рабочие прототипы и, кажется, что исследователям из Института физики в Мюнстерском университете и их коллегам из Гонконгского университета науки и техники удалось достичь значительных успехов в этом направлении

Оптически нейронные сети во многом превосходят электронные

Ключевая и наиболее привлекательная черта нейронных сетей — огромное количество взаимосвязей, которые образуют нейроны, подобно их биологическим аналогам в человеческом мозге. Эти связи дают им высокую способность к параллелизму, что позволяет выполнять множество операций одновременно, делая их гораздо более эффективными в задачах по распознаванию лиц или голоса, чем традиционные компьютерные системы, которые выполняют одну или несколько инструкций за раз.

Современные электронные нейронные сети достигают размера до восьми миллионов нейронов, но их будущее применение для искусственного интеллекта может быть ограничено из-за высокого энергопотребления и ограниченного параллелизма в соединениях. В то время как оптические соединения через линзы по своей сути параллельны изначально. Например, линза в вашем глазу фокусирует сразу весь поступающий свет на сетчатку в задней части глаза, где расположено множество детектирующих свет нервных клеток. Затем каждая клетка непрерывно передаёт оптический сигнал нейронам мозга, которые их обрабатывают, чтобы показать нам итоговое изображение.

Стеклянные линзы обрабатывают оптические сигналы путём фокусировки света, выполняя сложную математическую операцию, называемую преобразованием Фурье, которое помогает транслировать сигнал из аналогового вида в цифровой. Например, одним из применений преобразований Фурье является преобразование временных изменений интенсивности сигнала в график частот, присутствующих в сигнале. Военные использовали этот приём в 1950-х годах, чтобы преобразовать необработанные радиолокационные сигналы, записанные летящим самолётом, в трёхмерное изображение ландшафта. Сегодня это преобразование без проблем осуществляется современными компьютерами, а вот ламповые компьютеры 1950-х годов не справлялись с этой задачей.

Разработка нейронных сетей для искусственного интеллекта началась с их моделирования на классических компьютерах, но в таком виде ИИ был ограничен из-за медленной обработки данных и необходимости в значительных вычислительных ресурсах. Через некоторое время были разработаны гибридные нейронные сети, в которых оптика выполняет простые линейные операции, а электроника занимается более сложными нелинейными вычислениями. И вот сейчас две независимые группы исследователей продемонстрировали достаточно простые и полностью оптические нейронные сети, которые выполняют всю обработку данных самостоятельно.

Схематичное изображение нейронной сети из научной работы группы Вольфарама Перниса

Схематичное изображение нейронной сети из научной работы группы Вольфарама Перниса

В мае Вольфрам Пернис (Wolfram Pernice) из Института физики Мюнстерского университета в Германии и его коллеги сообщили о тестировании полностью оптического «нейрона», использующего специальный материал, изменяющий своё состояние при получении сигнала между жидким и твёрдым, что позволило использовать его для оптического хранения данных. С его помощью они продемонстрировали нелинейную обработку данных и выходные импульсы, похожие на импульсы органических нейронов. Затем учёные создали интегрированную фотонную схему, которая включала в себя четыре таких оптических нейрона, работающих на разных длинах волн, каждый из которых был подключен к 15 оптическим синапсам. Данная схема включала около 140 компонентов и смогла распознавать простые оптические структуры. Исследователи утверждают, что их устройство является масштабируемым, и в будущем данная технология обещает «доступ к высокой скорости и пропускной способности, присущей оптическим системам, что позволит напрямую обрабатывать оптические телекоммуникационные и визуальные данные». Исследование было опубликовано в журнале Nature.

Многослойная полностью оптическая нейронная система разработанная учёными из Гонконга

Многослойная полностью оптическая нейронная система, разработанная учёными из Гонконга

Теперь группа из Гонконгского университета науки и технологии опубликовала научную работу в журнале Optica, где они описали, как им удалось создать полностью оптическую нейронную сеть, основанную уже на другом физическом процессе — электромагнитно-индуцированной прозрачности, эффекте, при котором свет влияет на то, как атомы перемещаются между квантово-механическими уровнями энергии. «Этот процесс является нелинейным и может быть инициирован очень слабыми световыми сигналами», — объясняет Шенгванг Ду (Shengwang Du), профессор физики и соавтор статьи.

В своём эксперименте они подвергли воздействию света атомы рубидия, охлаждённые лазерами до примерно 10 микрокельвинов (на 10 микроградусов выше абсолютного нуля). Хотя метод может показаться необычайно сложным, как утверждает Ду, данная технология является наиболее простой и доступной для использования в лаборатории из тех, что могли дать желаемый эффект. «Будучи чисто квантовой атомной системой, она идеально подходит для этого эксперимента, чтобы доказать сам принцип работы», — утверждает он.

В будущем группа Шенгванга планируют увеличить размер системы при помощи использования горячего атомного пара, который является менее дорогим, не требует трудоёмкой подготовки по охлаждению атомов и в дальнейшем может быть интегрирован с фотонными чипами.

«Их демонстрация кажется верной и работоспособной», — комментирует Фолькер Зоргер (Volker Sorger), инженер-электрик из Университета Джорджа Вашингтона. Он соглашается, что полностью оптический подход очень привлекателен, так как предлагает очень высокий параллелизм, но частота обновления нейронов, по его мнению, в проекте Шенгванга составит примерно 100 герц из-за используемых в них жидких кристаллов, и потому Волкер не совсем уверен, что такую систему возможно масштабировать без ошибок.

В Китае ИИ выявил подозреваемого в убийстве, распознав лицо покойника

Мужчина, обвиняемый в убийстве своей подруги на юго-востоке Китая, был пойман после того, как программное обеспечение для распознавания лиц предположило, что он пытался отсканировать лицо трупа, чтобы подать заявку на кредит. Полиция провинции Фуцзянь сообщила, что 29-летний подозреваемый по имени Чжан был пойман при попытке сжечь тело на удалённой ферме. Офицеры были предупреждены компанией, которая выдаёт кредиты онлайн: система не обнаружила никаких признаков движения в глазах жертвы и подала об этом сигнал.

Simon Song

Simon Song

Чжан обвиняется в том, что задушил свою подругу верёвкой в ​​Сямыне 11 апреля после того, как у пары возник спор о деньгах, и женщина угрожала покинуть подозреваемого. Затем он якобы отправился в бега с телом, спрятанным в багажнике арендованного автомобиля. Чжан также обвиняется в том, что притворялся жертвой и связывался с работодателями последней через её учётную запись в социальной сети WeChat, чтобы договориться об отпуске.

Когда преступник прибыл в свой родной город Саньмин на следующий день, полиция получила сообщение, что он пытался подать заявку на кредит, используя приложение под названием Money Station. В последнем применяется нейросеть для проверки личности заявителей, а в процессе идентификации предлагается подмигнуть. Сотрудники кредитора связались с полицией после того, как при ручной проверке сомнительной заявки обнаружили синяки на лице женщины и толстую красную отметину на шее.

guvendemir/iStock

guvendemir/iStock

Программное обеспечение для распознавания голоса также обнаружило, что за получением кредита обратился мужчина, а не женщина. Чжан, формальный арест которого был одобрен прокуратурой в этом месяце, обвиняется ещё и в том, что использовал телефон жертвы, чтобы снять 30 000 юаней (около $4200) с её банковского счета и обманывал родителей покойной, сообщив им, будто женщина уехала на несколько дней, чтобы отдохнуть.

Хотя дата судебного разбирательства ещё не объявлена, подробности дела уже потрясли многих в Китае. Некоторые пользователи социальных сетей предположили, что сюжет слишком ужасен и напоминает скорее триллер (если не чёрную комедию), а другой писал: «Никогда не предполагал, что процесс распознавания лиц можно использоваться таким способом».

Нейросеть «Beeline AI - Поиск людей» поможет найти пропавших

«Билайн» разработал специализированную нейронную сеть, которая поможет в поиске пропавших: платформа получила название «Beeline AI - Поиск людей».

Решение призвано упростить работу поисково-спасательного отряда «Лиза Алерт». С 2018 года эта команда применяет беспилотные летательные аппараты для поисковых операций, проводимых в лесу и на промышленных территориях городов. Однако анализ снимков, получаемых с камер дронов, требует вовлечения большого количества волонтеров. К тому же на это уходит очень много времени.

Нейросеть «Beeline AI - Поиск людей» как раз и призвана автоматизировать процесс обработки фотографий. Утверждается, что специализированные алгоритмы позволяют сократить время на просмотр и сортировку полученных снимков в два с половиной раза.

Платформа использует технологии свёрточных нейронных сетей, что повышает эффективность работы средств машинного зрения. Обучение нейросети проходило на реальных подборках изображений. Испытания показали, что точность модели на тестовых изображениях приближается к 98 %.

Первостепенной задачей «Beeline AI - Поиск людей» является сортировка «пустых» и неинформативных фотографий, на которых точно нет человека или атрибутов, указывающих, что в этом месте был человек. Это позволяет группе анализа сразу сосредоточиться на потенциально результативных снимках.

Система может адаптироваться к различным условиям. Она одинаково точно находит объекты как с высот 30–40 метров, так и с высоты полёта 100 метров. При этом нейросеть способна обрабатывать изображения с высоким уровнем визуального «шума» — деревья, природный ландшафт, сумерки и т. д.

«Потенциально нейронная сеть способна находить людей и предметы во всех местах поиска, таких как лес, болота, поля, города, независимо от времени года и одежды человека, так как алгоритм настраивается на работу в любое время года и потенциально сможет распознавать нестандартное положение тела в пространстве, например, сидящего, лежащего или частично укрытого листвой человека», — отмечает «Билайн». 

Нейросети помогут в синтезе углеродных нанотрубок

Российские исследователи предложили технологию, позволяющую контролировать рост углеродных нанотрубок с помощью нейронных сетей. Ожидается, что это поможет в создании электронных устройств нового поколения.

Авторы работы — специалисты Лаборатории наноматериалов Сколтеха. Учёные объясняют, что тонкие плёнки из углеродных нанотрубок представляют собой самый перспективный на сегодняшний день материал для использования в оптоэлектронике, энергетике и медицине будущего. Однако существует проблема: контролировать многофазный процесс производства нанотрубок крайне сложно.

Российские специалисты предлагают использовать нейросети для анализа экспериментальных данных и предсказания эффективности синтеза однослойных углеродных нанотрубок.

В частности, метод предполагает применение искусственных нейронных сетей, обученных на таких экспериментальных параметрах, как температура, давление газов и скорость потока вещества, для контроля характеристик производимых плёнок из нанотрубок.

Учёные считают, что технология поможет создать эффективное производство углеродных нанотрубок, что откроет новые перспективы их применения. Результаты исследования опубликованы в журнале Carbon

Baidu выпустила ERNIE 2.0 — новую модель для понимания человеческого языка при помощи ИИ

В марте этого года китайская компания Baidu представила первую версию ERNIE (Enhanced Representation through kNowledge IntEgration), нового фреймворка и модели для обработки естественного языка (Natural Language Processing — NLP), который поднял настоящую волну в сообществе разработчиков NLP-систем, опередив Google BERT (Bidirectional Encoder Representations from Transformers) в различных задачах по анализу текстов на китайском языке. Теперь Baidu сообщила о выпуске новой версии модели — ERNIE 2.0. В своей исследовательской работе учёные из Baidu утверждают, что ERNIE 2.0 превосходит модели BERT и более современную XLNet в 16 задачах NLP на китайском и английском языках.

Вчера Baidu представила новую версию предварительно обученной нейронной модели ERNIE 2.0, предназначенной для решения задач связанных с пониманием естественного языка и показывающей лучшую производительность, чем существующие аналоги

Baidu представила новую версию предварительно обученной нейронной модели ERNIE 2.0

ERNIE представляет собой предварительно обученную нейронную сеть, созданную при помощи PaddlePaddle — открытой платформы для глубокого обучения, созданной в Baidu. Процесс предварительного обучения NLP-моделей, таких как BERT, XLNet и ERNIE, в основном базируется на нескольких простых задачах, моделирующих использование слов или предложений с учётом их связи и семантики. Например, BERT использует модель двунаправленного языка (bidirectional language model) и задачу по прогнозированию следующего предложения, чтобы получить информацию о совпадениях, а XLNet применяет модель языковых перестановок (permutation language model).

Структура ERNIE 2.0, в которой различные задачи для обучения могут ставиться одновременно и добавляться по мере необходимости, а сама модель может быть настроена для решения любого типа задач в области понимания естественного языка.

Структура ERNIE 2.0, в которой различные задачи для обучения могут ставиться одновременно и добавляться по мере необходимости, а сама модель может быть настроена для решения любого типа задач в области понимания естественного языка.

Но помимо порядка слов и их связи, в лингвистических системах есть гораздо более сложная лексическая, синтаксическая и семантическая информация. Например, различные названия и имена собственные — имена людей, географические названия и названия организаций — содержат концептуально важную информацию. В то же время информация о порядке и последовательности предложений даёт возможность NLP-моделям изучать языковые конструкции с учетом их структуры, а семантическое сходство и логические связи между предложениями позволяют исследовать семантические языковые правила. Таким образом языковым моделям для максимальной точности и производительности необходимо учитывать как минимум три указанных подхода. И исследователи Baidu задались вопросом: «Возможно ли использовать их параллельно и непрерывно? ».

Входные данные для ERNEIE включают в себя токены (единицы анализа текста), сами анализируемые предложения, данные о позициях токенов в них и необходимые для выполнения задачи.

Входные данные для ERNEIE включают в себя токены (единицы анализа текста), сами анализируемые предложения, информацию о позициях токенов в них и необходимые для выполнения задачи.

Основываясь на этой идее, они предложили структуру для непрерывного обучения модели пониманию языка, в которой задачи предварительного обучения могут создаваться в любой момент и выполняться за счёт заложенной многозадачности для обучения и кодирования лексической, синтаксической и семантической информации между ними. И всякий раз, когда добавляется новая задача, эта структура может постепенно обучать распределенные представления, не забывая ранее обученные параметры.

В тестировании на наборе данных GLUE для английского языка ERNIE 2.0 обошла BERT и XLNet в 7 задачах из 9

В тестировании на наборе данных GLUE для английского языка ERNIE 2.0 обошла BERT и XLNet в 7 задачах из 9

Команда Baidu сравнила производительность ERNIE 2.0 с другими NLP-моделями для английского языка на наборе данных GLUE и отдельно на 9 популярных наборах для китайского языка. Результаты показывают, что ERNIE 2.0 превосходит BERT и XLNet в 7 задачах на понимание английского языка и превосходит BERT по всем 9 задачам, когда дело касается китайского, таких как машинное чтение с использованием набора данных DuReader, семантический анализ и ответы на вопросы.

Чтобы узнать больше об ERNIE 2.0, вы можете прочитать исследовательскую работу на английском языке, а исходные коды и предварительно обученную модель можно загрузить с официальной страницы на GitHub.

Российская нейроплатформа E-Boi поможет повысить реакцию киберспортсменов

Российские исследователи из МГУ имени М.В. Ломоносова разработали нейроинтерфейсную платформу под названием E-Boi, предназначенную для тренировки киберспортсменов.

Предложенная система использует интерфейс мозг — компьютер. Создатели говорят, что решение позволяет повысить скорость реакции у любителей компьютерных игр и увеличить точность управления.

Схема применения платформы выглядит следующим образом. На первом этапе киберспортсмен проходит тестирование на скорость и точность в специально разработанном приложении. При этом с помощью электроэнцефалографических сенсоров система регистрирует активацию сенсомоторных участков коры больших полушарий мозга. Кроме того, выполняется калибровка платформы.

На следующем этапе осуществляется собственно тренировка. Киберспортсмен должен представлять, как выполняет задачи, не совершая при этом никаких движений. В это время в мозге происходит улучшение связи между нейронами коры и двигательными нейронами. После окончания «мысленной» тренировки исследователи вновь замеряют показатели пользователя в приложении.

МГУ

МГУ

«Наше предложение — оценивать по степени активации сенсомоторных зон коры то, насколько правильно человек представляет движения. Контролировать это можно как раз при помощи нейроинтерфейса, считывающего мозговую активность и оценивающего её интенсивность», — говорят разработчики.

Новой системой, как отмечается, уже заинтересовались российские киберспортивные клубы. Кроме того, в перспективе решение может помочь в реабилитации пациентов, перенёсших инсульт или нейротравму. 

Нейросеть DeepCubeA собирает кубик Рубика за секунду

По сообщениям сетевых источников, группа исследователей из Калифорнийского университета в Ирвине разработала ИИ-систему под названием DeepCubeA, которая способна собрать кубик Рубика всего за одну секунду.

Авторы проекта говорят о том, что представленная ИИ-система способна решить головоломку без каких-либо специальных знаний предметной области или тренировок. Рекордное достижение по сборке кубика Рубика человеком равно 5,25 с. Что касается DeepCubeA, то в некоторых случаях нейросеть может справиться с поставленной задачей за доли секунды.

Старший автор исследования профессор Пьер Балди (Pierre Baldi) рассказал о том, что до недавнего времени ИИ-системы научились побеждать людей в шахматы и го, но успешная сборка кубика Рубика на высокой скорости им не удавалась.

Теперь же система DeepCubeA успешно справилась со 100 % тестовых конфигураций, причём в 60,3 % случаев был найден кратчайший путь решения головоломки. Господин Балди сообщил о том, что обычно алгоритму требуется около 20 ходов, чтобы успешно выполнить задачу.

По мнению исследователей, сборка кубика Рубика предполагает наличие более символического, математического и абстрактного мышления. Созданный ими алгоритм показывает, что нейросеть становится ближе к тому, чтобы стать системой, способной думать, рассуждать, планировать и принимать решения. Учёные намерены продолжить свою работу, основной целью которой является создание ИИ-системы следующего поколения.

В MIT создали ИИ-систему, которая может создавать и обнаруживать поддельные изображения

Создание цифровой визуализации и редактирование изображений может отнимать много времени. Учёные из Массачусетского технологического института (MIT) совместно с инженерами IBM намерены изменить это. Их новая разработка построена на основе ИИ-системы, способной с нуля генерировать фотографические изображения, а также реалистично редактировать объекты внутри них.

Программа окажется весьма полезной для художников и дизайнеров, но у неё может быть более широкое применение. Разработка учёных даёт представление о том, как нейронные сети изучают контекст. Команда разработчиков надеется, что это поможет использовать ИИ-систему для выявления поддельных и изменённых изображений. Представленный учёными инструмент называется GANpaint Studio и в настоящее время он доступен в виде бесплатной демонстрации.

К примеру, вместо того, чтобы вручную добавлять бревно к изображению, можно просто указать место, а редактор самостоятельно нарисует объект, который вписывается в сцену. С такой же лёгкостью можно удалять лишние объекты с изображений. Несмотря на то, что GANpaint Studio находится в разработке, авторы проекта надеются, что в будущем созданный ими инструмент сможет использоваться для редактирования видеороликов.

В процессе разработки GANpaint Studio учёные были удивлены, когда обнаружили, что система усвоила простые правила об отношениях между объектами. К примеру, дверь не может находиться в небе, а облака на траве. Исследователи надеются, что это понимание позволит лучше понять, как нейронные сети изучают контекст. Система может использоваться не только для создания изображений, но и для обнаружения поддельных снимков.

Разработка учёных будет представлена широкой публике в рамках официального мероприятия, намеченного на следующий месяц.

Создана программа, убирающая людей с фото за секунды

Похоже, что высокие технологии свернули куда-то не туда. Во всяком случае, такая мысль возникает при ознакомлении с приложением Bye Bye Camera, которое недавно появилось в App Store. Эта программа использует искусственный интеллект и позволяет за секунды убирать с фотографий посторонних людей.

techcrunch.com

techcrunch.com

Программа использует для работы технологию YOLO (You Only Look Once), которая как утверждается, эффективно определяет человека на фото, замещая его специально подобранным фоном. Технически это похоже на автоматизированные инструменты из Adobe Photoshop, где сначала система определяет «контур» человека, затем анализирует фон и, наконец, удаляет случайно попавшего или нежелательного человека с фото.

Приложение пока что доступно только для мобильной операционной системы iOS. Скачать его можно по ссылке, однако за него придётся заплатить $2,99. О появлении подобного решения под Android пока не сообщается. На данный момент сложно сказать, насколько полезной будет такая программа. Её оценят разве что пользователи, которым нравится делать селфи, но при этом они не хотят видеть никого постороннего на снимке.

techcrunch.com

techcrunch.com

По данным ресурса TechCrunch, результаты работы программы пока не слишком однозначны, хотя определённые успехи есть. Разумеется, качество работы зависит от ряда параметров — условий съёмки, освещения и так далее. 

Напомним, что в начале года появилась информация о нейросети, которая генерирует лица несуществующих людей. И хотя пока что это больше игрушки, нежели реально используемые инструменты, успехи ИИ в области создания фейков, в том числе визуальных, потрясают и пугают одновременно.

Samsung улучшит ИИ-возможности мобильных процессоров

Компания Samsung Electronics объявила о намерении улучшить возможности своих нейронных модулей (NPU), предназначенных для выполнения операций, связанных с искусственным интеллектом (ИИ).

Блок NPU уже применяется во флагманском мобильном процессоре Samsung Exynos 9 Series 9820, который устанавливается в смартфоны семейства Galaxy S10. В дальнейшем южнокорейский гигант намерен интегрировать нейронные модули в процессоры для центров обработки данных и автомобильных систем, в том числе в чипы для платформ оказания помощи водителю (ADAS).

С целью развития направления NPU компания Samsung намерена создать более 2000 новых рабочих мест во всём мире к 2030 году, что примерно в 10 раз превышает текущую численность персонала, задействованного в разработке нейронных модулей.

Кроме того, Samsung укрепит сотрудничество с всемирно известными исследовательскими институтами и университетами и будет поддерживать развитие талантливых специалистов в области искусственного интеллекта, в том числе глубокого обучения и нейронной обработки.

Предполагается, что новые инициативы помогут Samsung расширить сферу применения ИИ-систем и предложить пользователям сервисы нового поколения. 

NVIDIA STEAL поможет ИИ лучше определять границы у объектов реального мира

Исследователи из NVIDIA, Университета Торонто и Института по изучению искусственного интеллекта Vector в Торонто разработали метод для более точного обнаружения границ, отделяющих одни объекты на изображениях от других. Эта технология может улучшить работу существующих моделей компьютерного зрения и помочь маркировать данные для обучения систем искусственного интеллекта. Например, в экспериментах, проведённых исследователями, STEAL (Semantically Thinned Edge Alignment Learning) позволяет повысить точность одной из современных моделей прогнозирования семантических границ CASENet на 4 %. При этом стоит отметить, что более точное распознавание границ у объектов может иметь приложение для самых разных задач компьютерного зрения, начиная от стандартных по обнаружению и классификации до генерации изображений и трёхмерного моделирования.

Исследователи из NVIDIA, Университета Торонто и Института Vector разработали модель, которая может помочь существующим системам машинного зрения с определением границ реальных объектов и их классификации

Исследователи из NVIDIA, Университета Торонто и Института Vector разработали модель, которая может помочь существующим системам машинного зрения с определением границ реальных объектов и их классификацией

STEAL обнаруживает границы объектов в пикселях при помощи метода, который исследователи называют «активным выравниванием». Как фреймворк он может применяться для улучшения существующих свёрточных нейронных сетей и моделей машинного зрения. Также учёные считают, что их разработка может помочь другим исследователям более эффективно маркировать или аннотировать данные для обучения их нейронных сетей. Чтобы доказать это, метод STEAL был использован для уточнения Cityscapes, набора визуальных данных в рамках городской среды, впервые представленного на конференции Computer Vision and Pattern Recognition (CVPR) в 2016 году, при этом удалось добиться увеличения точности сегментации в отдельных категориях до 1,2 %.

Пример работы STEAL в динамике

Пример работы STEAL в динамике

«Мы обнаружили, что наши результаты по предсказанию границ у объектов значительно лучше, чем те, которые по последним данным, демонстрирует модель DeepLab-v3, и это при использовании гораздо более лёгкой архитектуры», — пишут авторы исследования.

Научная работа «Дьявол в границах: изучение семантических границ в зашумлённых аннотациях» будет представлена в устной презентации на этой неделе на конференции CVPR 2019 в Лонг-Бич, Калифорния. Помимо неё десятки других исследовательских работ, многие из которых написаны исследователями из NVIDIA Research, будут представлены в выступлениях на конференции, сообщает компания NVIDIA в своём блоге.

Исходный код STEAL доступен для всех желающих на платформе GitHub.

window-new
Soft
Hard
Тренды 🔥