Теги → искусственный интеллект
Быстрый переход

AMD сделает ставку на ускорение ИИ в будущих чипах

Согласно недавнему интервью технологического директора AMD Марка Пейпермастера (Mark Papermaster) журналистам EETimes, компания AMD собирается присоединиться к гонке ускорителей задач глубинного обучения на клиентских и встраиваемых системах. Тем не менее, компания ещё не готова предоставить какие-либо подробности в этом отношении для своих 7-нм чипов x86 Ryzen 2 и GPU Vega/Navi, которые она намерена продвигать в течение следующего года, а также о планах после 7 нм.

«Существует потребность в высокой производительности с тем, что мы называем граничными вычислениями — задачами обработки данных, близкими к источнику, — причём часто необходим анализ в режиме реального времени, — сказал господин Пейпермастер. — Всеобъемлющая стратегия AMD в отношении машинного обучения предлагает движки ИИ как для центров обработки данных, так и для граничных вычислений».

В конце 2016 года AMD выпустила первые GPU-ускорители для задач глубинного обучения в центрах обработки данных. С тех пор Google TensorFlow Processing Unit и другие специализированные проекты продемонстрировали преимущества добавления массивов блоков умножения-сложения (multiply-accumulate, MAC) в аппаратные устройства для ускорения алгоритмов глубинного обучения.

В мае 2017 года основной конкурент AMD в графической сфере, NVIDIA, представил архитектуру Volta — первый GPU со встроенными блоками MAC, которые были названы тензорными ядрами (tensor cores). Intel тоже заявила в этом году, что планирует добавить свой ускоритель Movidius на материнские платы ПК под управлением Windows ML. Аналитики полагают, что Intel в конце концов добавит в обычные настольные процессоры ядра на основе Movidius.

Господин Пейпермастер не сказал, планирует ли AMD интегрировать MAC-массивы в 7-нм ускорители Vega, которые выйдут на рынок уже в конце этого года, или в x86-процессоры Zen 2, запланированные компанией на начало следующего года. Тем не менее, он отметил, что Vega будет поддерживать дополнительные форматы помимо 16-битных инструкций с плавающей запятой, которые сегодня поддерживают графические ускорители компании. В IT-индустрии ведётся оживлённое обсуждение путей упрощения нейронных сетей для ускорения задач глубинного обучения. ARM будет поддерживать 8-битные операции в своём ML Core, NVIDIA исследует перспективы двухбитовых операций, а Imec — однобитовую альтернативу.

Пока что публичные планы AMD распространяются только до продуктов Zen 3, которые будут выпускаться с использованием 7-нм EUV-техпроцесса (литография в крайнем ультрафиолетовом диапазоне), вероятно, начиная с 2020 года. Господин Пейпермастер отказался комментировать дальнейшие планы.

Контрактные производители уже приступают к освоению следующих 5-нм норм и ищут инвесторов для 3-нм техпроцесса. «Полупроводниковые фабрики повышают показатели производительности, эффективности на ватт и плотности транзисторов, но этот процесс неуклонно замедляется по сравнению с традиционными темпами „Закона Мура“, к которому индустрия привыкла. ...Мы будем использовать новые полноценные техпроцессы в порядке их освоения. ...Кроме того, у нас есть гетерогенный подход по использованию для ускорения вычислений CPU, GPU и других ядер на одном кристалле», — отметил Марк Пейпермастер.

AMD также рассчитывает на возможность использования преимуществ так называемой упаковки чипов 2.1D, которые применяются в смартфонах и могли бы пригодиться для улучшения мощных ПК и серверных чипов. В прошлом году господин Пейпермастер говорил, что такие варианты станут доступны через два–три года. Но в этом году они выглядят, к сожалению, ненамного ближе.

«Мы видим, что OSAT-компании используют новые методы, — отметил он. — Упаковки 2.5D доказали свою перспективность, и эксперименты с другими методами многослойного размещения кристаллов начнут приносить плоды с течением времени ...Я думаю, мы увидим альтернативы упаковке 2.5D в ближайшие несколько лет». Напомним: AMD усилила нажим на NVIDIA в 2015 году, выпустив графический ускоритель Fiji с памятью HBM в упаковке 2.5D. Но этот метод оказался относительно дорогим и до сих пор не подходит для массового рынка вроде игровых видеокарт.

Марк Пейпермастер не пожелал распространяться о прогрессе совместного предприятия AMD с китайской Tianjin Haiguang Advanced Technology Investment по выпуску серверных процессоров x86 на базе архитектуры Zen. И кратко отметил: «Подобно тому, как AMD Ryzen и EPYC были хорошо приняты рынком, думаю, x86-продукция нашего совместного предприятия будет пользоваться спросом. Там существует огромная установочная база, поэтому барьер для выхода на рынок минимальный».

DeepMind, Илон Маск и другие пообещали не создавать автономное оружие

Во время Объединённой конференции по искусственному интеллекту (Joint Conference on Artificial Intelligence) некоммерческая организация Future of Life Institute сообщила, что более 2,4 тысяч человек и 160 компаний из 90 стран подписали документ, в котором пообещали «не участвовать и не поддерживать разработку, производство, торговлю или использование смертельного автономного оружия».

Участники также призвали ввести запрет на такое оружие. Среди подписавших документ — DeepMind и её сооснователи Демис Хассабис (Demis Hassabis), Шейн Легг (Shane Legg) и Мустафа Сулейман (Mustafa Suleyman), а также Xprize Foundation и Илон Маск (Elon Musk).

То, ради чего некоторые компании предоставляют свои технологии правоохранительным органам, напрямую связано с обещанием не создавать автономное оружие. Google ранее раскритиковали из-за помощи Пентагону в создании технологий для военных дронов. Amazon поделилась с правительством системой распознавания лиц, что тоже не осталось незамеченным. А Microsoft обвинили в обслуживании Иммиграционной и таможенной полиции США.

В документе говорится, что «смертельное автономное оружие может стать мощным инструментом насилия и угнетения, особенно если связано с системами наблюдения и данных» и что «решение забрать человеческую жизнь никогда не должна принимать машина».

«Я рад видеть, что лидеры в области ИИ переходят от слов к действиям и реализуют систему правил, которую так и не смогли воплотить в жизнь политики, — заявил президент Future of Life Institute Макс Тегмарк (Max Tegmark). — ИИ сможет сильно помочь миру, если мы предотвратим злоупотребление им. ИИ-оружие, которое автономно решает убить человека, настолько же отвратительно и обескураживающе, как биологическое оружие, и разбираться с ним следует точно так же».

Microsoft и Walmart объединились, чтобы противостоять Amazon

Компании Microsoft и Walmart объединилась в стратегическое партнёрство с целью более эффективной конкуренции с Amazon как в сфере технологий, так и в области розничной торговли. Walmart на партнёрской конференции Microsoft Inspire объявила о том, что сотрудничает с Microsoft, чтобы использовать облачные службы последней. Пятилетнее соглашение подразумевает, что Walmart будет использовать Azure и Microsoft 365 наряду с новыми проектами, ориентированными на компьютерное обучение, искусственный интеллект и платформы данных.

Walmart является крупнейшим розничным конкурентом Amazon, а Microsoft — главным соперником на рынке облачных услуг. Эту конкуренцию исполнительный директор Microsoft Сатья Наделла (Satya Nadella) подчеркнул в интервью The Wall Street Journal, добавив, что именно она стало основой нового партнёрства: «Мы получаем больше рычагов влияния, поскольку две организации, которые отличаются масштабом, глубиной и хорошими инвестиционными возможностями, помогут опередить нашего общего соперника».

Технологическое партнёрство, разумеется, принесёт пользу обеим компаниям. Объявление о нём состоялось спустя несколько недель после того, как появились сообщения о работе Microsoft над конкурирующей с Amazon Go технологией для магазинов без кассиров. Сообщается, что Microsoft ведёт переговоры с Walmart по поводу этой технологии, причём программный гигант переманил одного из ведущих специалистов по машинному зрению из Amazon.

Напомним: магазин Amazon Go в Сиэтле является любопытным экспериментом, намекающем на будущее розничной торговли. Он использует несколько камер и датчиков, которые опираются на алгоритмы машинного зрения, чтобы определить, какие товары потребитель берёт с полок, и автоматически проводить платежи. Сообщается, что Microsoft экспериментирует с подключением камер к тележкам для отслеживания товаров.

Как Walmart, так и Microsoft не особенно распространяются об аспектах этого стратегического партнёрства. Тем не менее, новая сделка может стать уникальным испытательным полигоном, на котором Microsoft начнёт обкатывать свои амбициозные инициативы в области искусственного интеллекта и продвижения облачных служб для других розничных сетей.

Facebook отправила «бота-туриста» исследовать виртуальный Нью-Йорк

Обычно искусственный интеллект не очень хорошо справляется с использованием новой информации для лучшего понимания имеющейся. Facebook попыталась решить эту проблему необычным способом: она отправила ИИ на виртуальную прогулку.

Компания провела эксперимент, в рамках которого отправила «бота-туриста» исследовать 360-градусные изображения Адской кухни, одного из районов Нью-Йорка. В помощь ему был предоставлен «бот-гид», использовавший двухмерные карты. Первый должен был описывать, где он находится, по тому, что видит, а второй сообщал ему, куда двигаться дальше.

Проект был направлен на сбор информации посредством простого человеческого языка — например, бот мог использовать фразу «передо мной находится магазин Brooks Brothers». Но в ходе эксперимента исследователи выяснили, что боты работают эффективнее, если используют для общения своего рода синтетический язык, состоящий из символов. Другими словами, для того, чтобы помочь человеку найти нужную гостиницу, искусственный интеллект должен использовать другой язык, нежели для взаимодействия, скажем, с самоуправляемым автомобилем.

Исследование также помогло ИИ разобраться в визуально сложном городском окружении. Специальная система быстро анализировала наиболее подходящие слова в ответах ботов, чтобы они могли точнее сообщать, где находятся и куда должны двигаться дальше.

Этот проект может улучшить ИИ в целом, а не только помочь создать продвинутый навигационный продукт. Например, самоуправляемым автомобилям и заблудившимся людям было бы проще находить дорогу, не имея доступа к GPS.

ИИ от NVIDIA способен улучшить качество любой фотографии

Команда исследователей, в которую входят учёные Массачусетского технологический института и Университета Аалто, а также сотрудники NVIDIA, разработали электронную систему, способную улучшить качество любой фотографии. Новая технология обходится без дополнительных примеров или ограничительных параметров — достаточно лишь предоставить ей исходный снимок.

Исследователи применили метод глубокого обучения, чтобы заставить искусственный интеллект собирать изображения, текст и видео. Таким образом, ИИ научился улучшать качество изображений и удалять лишние элементы. Если раньше подобные системы могли восстановить фотографию человека, только рассмотрев альтернативный снимок с его лицом, то данной новинке достаточно только «повреждённых данных».

ИИ умеет не только улучшать качество картинки, но также удаляет артефакты и другие ненужные элементы.

Авторы исследований использовали разные типы синтетического «шума» на изображения, и получили результаты, которых аналогичные системы достигали только с помощью дополнительных материалов. Со временем новая система позволит значительно сократить время обработки изображений и графики.

В официальных документах исследователей говорится: «Существует возможность обучить восстанавливать изображения без изучения исходников, при этом результат часто превосходит методы обучения с использованием чистых примеров. Нейросети не уступают ведущим методам, применяющим чистые примеры, и используют те же методы тренировки, часто без существенных недостатков, выраженных в потраченном на тренировки времени и производительности».

Самым очевидным практическим применением новой системы учёные считают медицину. Снимки, полученные в ходе магнитно-резонансной томографии, выглядят намного чётче после обработки. С их помощью врачу намного легче определить проблему и поставить верный диагноз.

Пока не ясно, как руководство NVIDIA решит распорядиться предоставленной технологией.

Apple объединила команды машинного обучения, Siri и Core ML под руководством бывшего главы Google по ИИ

Apple объединила различные подразделения, занимающиеся искусственным интеллектом, в единую структуру. Её руководителем стал недавно нанятый компанией Джон Джайаннандреа (John Giannandrea), бывший глава Google по поиску и ИИ.

Сперва о реструктуризации сообщил TechCrunch, после чего Apple подтвердила изменение, добавив соответствующую информацию на страницу с топ-менеджерами. Джайаннандреа будет отвечать за команды, которые занимаются машинным обучением, голосовым помощником Siri и фреймворком Core ML. Последний представляет собой API, который помогает разработчикам сторонних приложений оптимизировать ИИ-задачи в приложениях для iOS.

Джайаннандреа получил должность руководителя отдела машинного обучения и стратегии ИИ. Очевидно, что Apple возлагает на новую структуру большие надежды. Она сильно отстаёт в ключевых сферах искусственного интеллекта — например, обработки естественного языка и компьютерного зрения. Обе важны как для Siri, так и для более продвинутых технологий вроде дополненной реальности, в которой активно используется распознавание объектов.

Из-за приверженности конфиденциальности пользователей и невысокой активности в сообществе исследователей искусственного интеллекта Apple не может похвастаться объёмными базами данных для тренировки новых алгоритмов и не имеет возможности привлечь талантливых сотрудников. Последние обычно уходят к Facebook, Google и другим гигантам Кремниевой долины.

Поэтому в новых, прибыльных сферах у Apple не самое выгодное положение. С созданием новой структуры компания надеется, что универсальное видение, объединение ресурсов и тесное сотрудничество помогут ей наверстать упущенное.

Box купила Butter.ai, чтобы сделать поиск «умнее»

Box сообщила о покупке стартапа Butter.ai, который помогает более эффективно искать контент в облаке. Условия сделки не разглашаются, но известно, что команда Butter.ai присоединится к Box.

Стартап открыли два бывших сотрудника Evernote, Джек Хирш (Jack Hirsch) и Адам Уольц (Adam Walz). Компания была частично профинансирована основателем и бывшим генеральным директором сервиса для создания заметок Филом Либином (Phil Libin).

Некоторое время назад Box начала расширять возможности искусственного интеллекта. Теперь Butter.ai получит доступ к наработкам Box в этой сфере и сможет улучшить поисковую систему облачной платформы.

«Команда Butter.ai поможет Box сделать поиск более “умным”, благодаря чему 85 тысячам клиентов Box станет проще разобраться в их неструктурированной информации — поиск файлов в Box станет более контекстуальным, предиктивным и персонализированным», — написал директор по продукту компании Джиту Патель (Jeetu Patel).

Это означает, что в сервисе станет проще находить документы, имеющие значение для той или иной должности. Например, если вы продавец и ищете договор, то вам, очевидно, нужен договор о продаже, а не о бизнес-партнёрстве.

Butter.ai появилась в сентябре 2017 года, а её продукт до недавнего времени выступал как поисковый помощник в Slack. Теперь стартап от этого продукта избавится.

Как это часто бывает, две компании некоторое время тесно сотрудничали. Поэтому нет ничего удивительного в том, что теперь Box решила поглотить Butter.ai.

Видео: для симуляции волос в будущих играх, возможно, будет задействован ИИ

Исследователи из Университета Южной Калифорнии, Pinscreen и Microsoft разработали технику рендеринга волос, основанную на методах глубинного обучения. Эта нейронная сеть может визуализировать в 3D модели волос на основе эталонного 2D-изображения и является первой в своём роде, работающей в реальном времени. В играх методы рендеринга волос вроде NVIDIA GameWorks HairWorks или AMD TressFX Hair подчас приводят к значительному снижению производительности, даже если результат оказывается далёким от идеала. Вывод нескольких сотен тысяч отдельных волосков — очень ресурсоёмкая задача.

Но исследователи в области ИИ полагают, что свёрточная нейронная сеть поможет в реализации этой сложной задачи. «Реалистичное моделирование волос — одна из самых сложных задач при оцифровке виртуальных людей, — отметили исследователи. — В отличие от объектов, которые легко параметризуются, вроде человеческого лица, волосы охватывают широкий диапазон вариаций формы и могут быть очень сложными из-за их объёмной структуры и уровня деформируемости каждого волоска».

Чтобы обучить нейронную сеть, исследователи передали ей набор данных из 40 тыс. различных причёсок и 160 тыс. двумерных изображений с разных углов обзора. Цель была достигнута — нейронная сеть смогла создавать реалистичную трёхмерную визуализацию волос разной длины, стиля и цвета, пользуясь лишь одним 2D-изображением. За миллисекунды. Нейронная сеть также может имитировать видео и отображать движение отдельных прядей волос, взаимодействующих друг с другом.

«Волосы, воссозданные по нашему методу, могут точнее передавать детали и выглядят более естественными, — отмечают исследователи. — Особенно в случае с кудрявыми людьми». Это не идеальная система, некоторые причёски плохо воссоздаются. Однако исследователи полагают, что дальнейшее обучение алгоритма на основе ещё бо́льшего количества причёсок может помочь повысить качество.

Учитывая тот факт, что в будущих ускорителях NVIDIA появится поддержка ускорения задач машинного обучения (AI Tensor Cores), применение подобных методов для более качественной визуализации волос и других сложно алгоритмизуемых задач в играх будет вполне закономерным развитием событий. Пока же данная технология может существенно упростить жизнь разработчикам, позволив им создавать реалистичные волосы прямо на стадии захвата движений.

Учёные MIT научили ИИ различать музыкальные инструменты на видео

Исследователям Массачусетского технологического института удалось построить нейросеть, способную различать звуки отдельных музыкальных инструментов на видео. Искусственный интеллект под названием PixelPlayer даже может сделать отдельные источники звука громче или тише.

«Мы рассчитывали, что в лучшем случае сможем указать, какие звуки производит отдельный инструмент. Удивительно, что мы смогли обнаружить инструменты в пространстве на уровне пикселей. Эта способность открывает множество возможностей, например, редактирование аудиодорожки с помощью клика по видео», — заявил один из авторов ИИ.

В основе PixelPlayer лежит нейронная сеть, освоившая 714 видеороликов YouTube, входящих в набор данных под названием «Многомодальные источники комбинаций инструментов» (Multimodal Sources of Instrument Combinations, “MUSIC”). Первые пятьсот видеороликов длиной в 60 часов нейросеть обучалась, остальное время учёные использовали для проверки результатов.

PixelPlayer работает самостоятельно, программа может разделить звуки более чем двадцати инструментов, и пользователю не нужно готовить какие-либо заметки. Учёные уверены, что получив больше данных, ИИ научится различать и больше наименований, но пока что им трудно настроить неочевидные различия между классами музыкальных инструментов.

«Мы рассчитываем, что работа поможет раскрыть новые области исследования проблемы разделения источника звука с помощью визуальных и аудиосигналов», — отметили исследователи.

Патент Microsoft описывает метод выявления читеров на основе ИИ

Microsoft подала в 2017 году заявку в Управление по патентам и товарным знакам США, в которой описала основанный на нейронных сетях метод обнаружения мошенничества или читерства на игровых платформах вроде Xbox Live. Опубликованное на днях описание патентной заявки предусматривает использование машинного обучения для распознавания «чуждых» взаимодействий между игрой и игровой платформой.

Патент описывает идею, с помощью которой платформодержатель может автоматически определять читеров в играх от сторонних разработчиков. Речь идёт о случаях, когда игрок совершает в игре мошенничество и, избежав обнаружения встроенной в игру античитерской системой, получает внешние достижения и награды — например, в рамках Xbox Live.

Для борьбы с этим злом Microsoft и предлагает использовать ИИ-алгоритм, оптимизированный с помощью машинного обучения под распознавание необычных закономерностей в активности поступления уведомлений о достижениях, отчётах об игре или других взаимодействиях между игрой и службой, подобной Xbox Live.

«Функции классификации могут помечать различную активность игрока как нормальную или „чуждую“, после чего подозрительная активность может быть дополнительно проанализирована на предмет возможных мошеннических действий. Таким образом, потенциально очень большое количество данных игрока можно просеять на предмет возможного читерства на основе закономерностей, которые трудно распознать с помощью ручных методов», — сообщается в описании патента.

Хотя заявка и опубликована, она пока ещё не утверждена и не отклонена.

В «Яндекс.Браузере» появился «умный» переводчик веб-страниц

«Яндекс.Браузер» обзавёлся двумя новыми функциями, которые, как утверждают разработчики, существенно улучшили качество перевода веб-страниц.

Одно из изменений коснулось системы выборочного перевода слов и фраз. Раньше для этих целей применялся исключительно статистический метод, то есть, веб-обозреватель самостоятельно обучался на большом количестве статей и их переводов. Но такой подход не учитывает природу слов и связи между ними, из-за чего результат перевода может выглядеть неестественно.

Новый инструмент использует гибридную модель: статистический метод дополнен нейронными сетями. Браузер переводит текст двумя способами, а затем специальный алгоритм оценивает, какой перевод лучше. Вариант, получивший более высокую оценку, демонстрируется пользователю.

Ещё одно нововведение связано с тем, что теперь браузер при переводе учитывает расположение текста на веб-странице и его оформление. Это позволяет определять тип фразы или надписи — скажем, навигационный элемент, заголовок или основной текст. Данные характеристики затем учитываются при переводе, что позволяет дополнительно повысить его качество.

Отмечается, что реализованные изменения позволили повысить качество переводов в «Яндекс.Браузере» в 1,7 раза по сравнению с прежними результатами. Более того, увеличилась скорость работы, поскольку теперь переводится не вся страница целиком, а только та часть, которую в данный момент видит пользователь. 

Новая статья: Крупным планом: система «умной» аналитики корпоративных коммуникаций Yva

Данные берутся из публикации Крупным планом: система «умной» аналитики корпоративных коммуникаций Yva

Google Duplex действительно работает — тестирование начнётся этим летом

На днях в ресторане в Маунтин-Вью (Калифорния) Google предоставила нескольким группам журналистов возможность ознакомиться с Duplex. Если кто забыл, Duplex — это технология на базе искусственного интеллекта, предназначенная для того, чтобы делать голосовые звонки от имени пользователя для автоматизации заказов столов в ресторане или записи в парикмахерскую. В демонстрации каждый журналист получил телефонный звонок от Duplex, и система попыталась договориться с ними о бронировании.

Поисковый гигант в лице вице-президента по маркетингу и дизайну Google Assistant Ника Фокса (Nick Fox) также объявил, что собирается начать ограниченное тестирование «в ближайшие недели». Это не значит, впрочем, что обычные пользователи смогут опробовать технологию так скоро: компания начинает с набора доверенных тестеров. Обкатка будет ограничена только предприятиями, с которыми Google сотрудничает.

Другими словами, развёртывание осуществляется поэтапно. Сначала будут отработаны звонки с вопросами о нерабочих часах, позже этим летом начнёт тестироваться бронирование столика в ресторане, а ещё позже — запись в парикмахерскую. Это единственные три функции, которым Google пока обучила Duplex.

Журналисты The Vegre сообщили, что показанная им демонстрация действительно была близка к тому, что мы видели на Google I/O, включая настолько запомнившиеся публике междометия вроде «ага» и «угу» в речи робота. В ней также было новшество: каждый вызов начинался с заявления о том, что звонок осуществляет машина и он записывается. Например, один вызов начался так: «Привет, я звоню, чтобы сделать заказ. Я автоматический сервис бронирования Google, поэтому я запишу звонок. Я могу заказать столик на утро воскресенья?».

Голос звучал так же естественно, как и в приведённом видео. Google тестирует, как людям наиболее комфортно беседовать с автоматикой и варьирует степень роботизированности голоса. Также после начального представления и предупреждения о ведущейся записи робот обычно коротко произносит междометие «эмм», после чего переходит непосредственно к просьбе о бронировании.

В первых прототипах Google голос не был столь естественным и человекоподобным. «Это не сработало. ...у нас было много брошенных трубок и незавершённых задач. Людям не нравилось, как неестественно звучит синтезированная речь», — отметил вице-президент по инженерным вопросам Google Assistant Скотт Хаффман (Scott Huffman). Потому в конце концов и появились все такие речевые недостатки, как «ахи» и «хмыканья», играющие важную роль в коммуникации людей наряду с жестами рук и так далее — эти аспекты изучает прагматика (раздел лингвистики).

В нескольких штатах вроде Техаса Duplex не будет работать — Google пока не получила там разрешения, но всё же почти на всей территории США в ближайшее время начнутся тесты. К сожалению, пока Duplex работает только на английском языке, но при этом Google потрудилась, чтобы система могла понимать множество диалектов и акцентов.

Поисковый гигант не спешит в вопросе развёртывания Duplex ещё и потому, что хочет быть максимально осторожным в столь новой и пока не особенно изученной области, как искусственный интеллект. Это одна из причин, по которой первоначальное тестирование будет проводиться только с предприятиями, с которыми сотрудничает Google. Компаниям будет разрешено выйти из программы приёма звонков от Duplex. Также Google не желает пока, чтобы звонков от роботов было слишком много и старается исключить использования технологии для розыгрышей. Поэтому Duplex будет сообщать номер телефона или email пользователя, от имени которого звонит.

Сообщается, что Duplex неплохо справляется, когда человек перебивает, отвечает на вопросы не по порядку и даже делает странные отвлечённые утверждения. Когда голос человека звучал смущённо или взволнованно, тон Duplex становился едва ли не извиняющимся — по-видимому, голосовой помощник старается имитировать внимательного и неконфликтного клиента.

Конечно, система пока несовершенна: все звонки, с которыми Duplex не справляется, отправляются в Google для анализа и улучшения ИИ-алгоритмов. Например, сейчас ИИ можно сбить с толку, если бармен на просьбу забронировать столик ответит, что заказ может быть оформлен на 7 часов, но полное обслуживание работает только до 6 часов, так что придётся довольствоваться только едой, доступной в баре. Но ведь это только начало.

Искусственный интеллект OpenAI потягается с лучшими игроками Dota 2 на The International 2018

OpenAI рассказала о своём последнем достижении: исследовательская лаборатория натренировала команду ИИ, которая имеет шансы победить лучших игроков в Dota 2.

OpenAI в августе прошлого года впервые представила систему, которая могла бы победить лучших игроков Dota 2 в матчах «1 на 1». Однако этот режим значительно снижает сложность матча. Тогда исследователи обновили своих ботов, чтобы играть против людей в матчах «5 на 5», которые требуют координирования усилий и долгосрочного планирования. И хотя OpenAI всё ещё не бросила вызов самым лучшим игрокам, она сделает это позже в нынешнем году, на международном турнире по Dota 2, The International.

Мотивация для таких исследований проста: если мы можем научить системы искусственного интеллекта навыкам, необходимым для игры в видеоигры, мы можем использовать их для решения сложных реальных задач, которые в некотором роде выполняются тем же образом, например, управление транспортной инфраструктурой города.

Видеоигры предлагают такие испытания, которые настольные игры (шахматы или го) предложить не могут. Они скрывают информацию от пользователей — ИИ не может воспринимать всё игровое поле и рассчитывать наилучший следующий ход. В них также больше информации для обработки и огромное количество возможных шагов. Как заявляет OpenAI, в каждый момент бот, играя в Dota 2, должен выбирать между 1000 различными действиями при обработке 20000 единиц входных данных, которые представляют собой то, что происходит в матче.

Чтобы создать своих ботов, лаборатория обратилась к методу машинного обучения, известному как усиленное обучение (reinforcement learning). Это обманчиво простой метод, который может привести к сложному поведению. Агенты ИИ бросаются в виртуальную среду, где они учатся тому, как достичь своих целей путём проб и ошибок. Программисты устанавливают так называемые функции вознаграждения (начисление ботам очков за такие вещи, как убийство врага), а затем оставляют ботов играть снова и снова.

В общей сложности боты ежедневно играли 180 лет. Так они тренировались в течение нескольких месяцев. «[Сперва бот] начинает совершенно случайно блуждать по карте. Затем, через пару часов, он начинает обучаться первым базовым навыкам», — сказал сооснователь OpenAI Грег Брокман (Greg Brockman). По его словам, если человеку требуется от 12 тысяч до 20 тысяч часов игры, чтобы стать профессионалом, это означает, что агенты OpenAI «играют 100 человеческих жизней каждый день».

Хотя боты OpenAI теперь играют матчи «5 на 5», они всё ещё не подвержены полной сложности Dota 2. Существует ряд ограничений. Они играют только с помощью пяти из 115 доступных героев, каждый из которых имеет свой собственный стиль. Их выбор: Necrophos, Sniper, Viper, Crystal Maiden и Lich. Некоторые элементы их процессов принятия решений строго закодированы, например, какие предметы они покупают и какие навыки повышают. Были отключены и другие сложные участки игры, в том числе невидимость, призывы и расстановка вардов. Последние действуют как удалённые камеры и имеют важное значение в MOBA.

Агенты OpenAI также имеют все преимущества компьютера. Их скорость реакции быстрее, чем у людей, они никогда не промахиваются и у них есть мгновенный и точный доступ к таким данным, как запасы предметов, здоровье героев и расстояние между объектами на карте, которые имеют решающее значение для правильного использования определённых заклинаний.

По словам Брокмана, способность играть целые матчи в Dota 2, которые длятся в среднем 45 минут — это то, что отличает ботов OpenAI. Такое долгосрочное планирование считалось трудным или даже невозможным для обучения по используемому методу. Главная причина успешности подхода, говорит Брокман, в том, что у лаборатории имеется более мощный компьютер.

Андреас Теодору (Andreas Theodorou), исследователю ИИ в университете Бата, который использует компьютерные игры для изучения сотрудничества, говорит, что последние изучения данных по играм «5 на 5» — это большой шаг вперёд. Хотя он отмечает, что, возможно, самым значительным достижением является использование OpenAI визуализации для отладки своих агентов. «Эти методы показывают, что даже усиленное обучение и машинное обучение в целом может быть прозрачным», — сказал Теодору.

Использование исследователями отдельной функции вознаграждения ботов к совместной работе также примечательно, говорит Теодору. Она была названа Team spirit («командный дух»). Вознаграждение увеличивается каждый матч. Благодаря ей боты, начиная игру, преследуют индивидуальные цели, такие как убийства, но со временем всё больше фокусируются на общих задачах. «Боты полностью готовы пожертвовать линией или отказаться от героя для общего блага, — сказал Брокман. — Для интереса мы поместили человека, чтобы заменить одного из ботов. Мы не учили их делать что-то особенное, но он сказал, что ощущал хорошую поддержку. Боты давали всё, что он хотел».

Команда ботов OpenAI в настоящее время сыграла пять матчей против нескольких любительских и полупрофессиональных команд. Счёт 4:1 в пользу ИИ. Но самый большой вызов их ждёт позже, на The International. Смогут ли они победить лучших из лучших? Увидим уже в августе.

Adobe использует ИИ для определения «фотошопа»

Редактирование фотографий с целью их улучшения в художественно-композиционном или содержательном отношении используется уже больше столетия, но цифровые инструменты вроде Adobe Photoshop довели этот процесс до совершенства, предоставив безграничные возможности внесения правок с высоким уровнем достоверности. Из-за сложности определения подделки манипуляция подложными фотофактами стала массовым явлением. Подобные «утки» нередко успевают получить вирусную популярность до момента разоблачения, а довести до всех опровержение нередко не представляется возможным.

«Ответственный» за происходящее создатель Photoshop намерен повысить доверие и уровень подлинности цифровых медиа и желает предоставить инструмент проверки изображения на отсутствие добавленных или удалённых объектов. Adobe видит путь к решению проблемы в использовании технологий искусственного интеллекта. Это ставит компанию в один ряд с Facebook и Google, которые наращивают свои усилия по борьбе с поддельными новостями.

При редактировании композиции изображения пользователь всегда оставляет более или менее заметные следы своего вмешательства. Визуально качественную работу сложно оспорить, но существуют особые малозаметные маркеры на уровне пикселей, опираясь на которые, можно определить подлог. Речь идёт о разнице в оттенках, яркости, резкости между исходным изображением и вставкой, о размытых границах, нарушениях в шумовой картине матрицы или JPEG-сжатия, о характерных артефактах при клонировании, вклеивании и удалении, а также об использовании информации из метаданных. Adobe утверждает, что сможет выявлять признаки манипуляции с фотографиями быстро и надёжно.

Характерным для методов машинного обучения способом команда Adobe совместно с исследователями из Университета штата Мэриленд заставляла компьютер сравнивать десятки тысяч редактированных изображений с их подлинниками. Благодаря этому искусственный интеллект научился за секунды выявлять типы использованных манипуляций и зоны редактирования. По словам Adobe, методы ещё не идеальны, но предоставляют больше возможностей для выявления цифровых подлогов, а потенциально в будущем смогут эффективно отвечать на вопросы подлинности.

Неизвестно, как скоро этот или подобные инструменты станут доступны хотя бы организациям, но это непременно произойдёт ввиду высокой востребованности в эффективном противоядии цифровым подделкам, наводнившим информационную среду.