Теги → openai
Быстрый переход

ИИ научился рисовать изображения по их текстовому описанию

Скоро андроиды будут не только мечтать об электроовцах, но даже смогут изобразить их на холсте. На днях компания OpenAI, к основанию которой в своё время приложил руку Илон Маск, сообщила, что смогла обучить нейронную сеть создавать рисунки из коротких текстовых подписей. Это первое решение, когда ИИ создаёт сложное и связное визуальное представление, используя лишь короткое текстовое пояснение. Профессия художника-иллюстратора может исчезнуть.

Источник изображения: OpenAI

Источник изображения: OpenAI

Для графических представлений подписей компанией OpenAI обучено программное обеспечение Dall-E. Для обучения через нейросеть прогнали набор данных из 12 млрд изображений и их подписей, которые были найдены в Интернете. Результат обучения впечатлил даже создателей.

«Мы обнаружили, что он [Dall-E] обладает разнообразным набором возможностей, включая создание антропоморфных версий животных и объектов, комбинирует несвязанные концепции правдоподобными способами, рендерит текст и применяет преобразования к существующим изображениям», — написала компания. Ниже на иллюстрации представлен пример изображений, которые Dall-E нарисовал на базе двух текстовых сообщений, одно о детёныше дайконе (редисе) в балетной пачке выгуливающей собаку, а второе — о кресле в форме авокадо.

Иллюстрация маленькой редиски дайкон в балетной пачке, выгуливающей собаку, автор DALL-E

Иллюстрация маленькой редиски (дайкон) в балетной пачке, выгуливающей собаку, автор DALL-E

Кресло в форме авокадо, автор DALL-E

Кресло в форме авокадо, автор DALL-E

Программа Dall-E, сочетающая в своём названии имя художника-сюрреалиста Сальвадора Дали и имя мультяшного персонажа Wall-E, имеет в своей основе текстовый генератор под названием GPT-3 (Generative Pre-Training). Генератор GPT-3 компания OpenAI представила весной прошлого года и готовится к коммерциализации API для этой разработки. Система, обученная GPT-3, оказалась способной создавать связные тексты как для чат-ботов, так и виде развёрнутых статей на любую тематику. В дополнение к GPT-3 пакет Dall-E прошёл также обучение текстом и графикой, показав тот результат, который всем нам ещё предстоит осмыслить.

Разработчики из OpenAI признают, что Dall-E обладает «потенциалом значительного и широкого общественного воздействия», добавив, что компания «планирует проанализировать потенциальное влияние подобных Dall-E решений на определенные рабочие процессы и профессии, долгосрочные этические проблемы и другие вопросы, связанные с этой технологией».

От рока до хип-хопа: искусственный интеллект OpenAI научился создавать музыку с вокалом

Исследовательская компания OpenAI представила Jukebox — искусственный интеллект, сочиняющий музыку с осмысленными текстами и вокалом. Зарубежные журналисты сообщают, что это самый впечатляющий ИИ для написания музыки, который они видели.

Система Jukebox обучалась на основе множества отрывков из песен самых разных жанров, от классического рока до хип-хопа. Подобно тому, как другие нейронные сети способны имитировать стили рисования знаменитых художников, новый проект OpenAI может создавать музыкальные композиции как у исполнителей, на треках которых он обучался. Например, он может сочинить музыку в стиле кантри-певца Джонни Кэша, рэпера Drake и даже российской поп-группы «Тату».

«Мы показываем, что наши модели искусственного интеллекта могут создавать песни на основе самых разных музыкальных жанров, таких как рок, хип-хоп и джаз. Они могут создать мелодию, ритм и тембры для самых разных инструментов, а также стили и голоса певцов, которые будут звучать вместе с музыкой», — объяснили представители OpenAI.

Компания обучает искусственный интеллект сочинению музыки далеко не первый год. Ранее она уже демонстрировала возможности системы MuseNet, которая самостоятельно сочиняла полноценные MIDI-композиции. Но искусственный интеллект, способный создавать песни разных жанров с вокальными партиями, это для неё что-то новое.

На данный момент музыка OpenAI впечатляет, но далека по качеству от идеала. Искусственному интеллекту пока явно не хватает мастерства, чтобы воссоздать полную структуру музыки с куплетами и повторяющимися припевами.

На создание одной минуты музыкального трека искусственному интеллекту Jukebox требуется около 9 часов. Так что компания пока не может создать приложение, где музыкальные композиции сможет создавать каждый. Зато разработчики опубликовали результаты работы Jukebox. Послушать их можно на специальном сайте.

OpenAI обучает ИИ командной работе в игре в прятки

Старая добрая игра в прятки может стать прекрасным испытанием для ботов с искусственным интеллектом (ИИ), позволяющим продемонстрировать, как они принимают решения и взаимодействуют, как друг с другом, так с различными окружающими объектами.

В своей новой статье, опубликованной исследователями из некоммерческой организации OpenAI, занимающейся исследованиями в области искусственного интеллекта и прославившейся победой над чемпионами мира в компьютерной игре Dota 2, учёные описывают как агенты, контролируемые искусственным интеллектом, обучались как изощрённее искать и прятаться друг от друга в виртуальной среде. Результаты исследования продемонстрировали, что команда из двух ботов обучается эффективнее и быстрее, чем любой отдельный агент без союзников.

В своей новой работе исследователи из OpenAI продемонстрировали как искусственный интеллект может обучаться намного эффективнее и использовать объекты окружения в команде, играя в прятки друг против друга

В своей новой работе исследователи из OpenAI продемонстрировали, что искусственный интеллект может обучаться намного эффективнее и быстрее в группах из несколько агентов на примере игры в прятки

Учёные использовали уже давно завоевавший свою славу метод машинного обучения с подкреплением, в котором искусственный интеллект помещается в неизвестную ему среду, имея при этом определённые способы взаимодействия с ней, а также систему наград и штрафов за тот или иной результат своих действий. Данный метод достаточно эффективен благодаря возможностям ИИ выполнять различные действия в виртуальной среде с огромной скоростью, в миллионы раз быстрее, чем может представить человек. Это позволяет методом проб и ошибок найти наиболее эффективные стратегии для решения поставленной задачи. Но у данного подхода также есть некоторые ограничения, например, создание среды и проведение многочисленных циклов обучения требует огромных вычислительных ресурсов, а сам процесс нуждается в точной системе сопоставления результатов действий ИИ с поставленной ему целью. Кроме того, приобретенные агентом таким образом навыки ограничены описанной задачей и, как только ИИ научится с нею справляться, никаких улучшений большей уже не будет.

Для обучения ИИ игре в прятки учёные использовали подход, называющийся «ненаправленное исследование» (Undirected exploration), который заключается в том, что агенты имеют полную свободу действий для развития своего понимания игрового мира и разработки выигрышных стратегий. Это похоже на подход к многоагентному обучению, который применяли исследователи из DeepMind, когда несколько систем искусственного интеллекта были обучены играть в режиме «захват флага» в игре Quake III Arena. Как и в этом случае, агенты ИИ не были заранее обучены правилам игры, но со временем они выучили базовые стратегии и даже смогли удивить исследователей нетривиальным решениями.

При игре в прятки нескольким агентам, чьей задачей было прятаться, было необходимо избегать прямой линии видимости соперников после небольшой форы во времени, пока команда ищущих агентов была обездвижена. При этом «линия видимости» в данном контексте представляет собой конус в 135 градусов перед отдельным ботом. Агенты не могли удаляться слишком далеко за пределы игровой площадки и были вынуждены перемещаться по случайно сгенерированным комнатам с возможностью использовать некоторые внешние объекты (ящики, передвижные стены, специальные пандусы), разбросанные вокруг, которые можно было использовать как для создания укрытий, так и для проникновения в них.

ИИ выработал шесть стратегий игры, которые последовательно сменяли друг друга по мере обучения и совершенствования противников относительно друг друга

ИИ выработали шесть стратегий игры, которые последовательно сменяли друг друга по мере обучения и совершенствования противников относительно друг друга

В результате долгого процесса обучения ИИ-агенты освоили шесть уникальных стратегий, каждая из которых помогала им переходить к следующему этапу игры. Вначале команды ищущих и прячущихся просто убегали и преследовали друг друга, но после примерно 25 миллионов матчей команда прячущихся научилась блокировать проходы коробками и строить из них укрытия. После ещё 75 миллионов матчей команда ищущих обнаружила способы использовать пандусы, чтобы проникать в эти укрытия. Спустя ещё 10 миллионов раундов прячущиеся научились оттаскивать пандусы к краю игровой площадки и фиксировать их на месте, чтобы не позволить противникам использовать их.

После 388 миллионов матчей ищущая команда научилась использовать специальные пандусы, чтобы проникать в укрытия противника

После 88 миллионов матчей ищущая команда научилась использовать специальные пандусы, чтобы проникать в укрытия противника

После 388 миллионов матчей ищущие научились использовать заблокированные пандусы, чтобы подняться на принесённые к ним ящики, а затем, перемещаясь прямо на них, проникать в созданные из переносных стен укрытия противников. И, наконец, после 458 миллионов матчей прячущаяся команда сделала вывод, что нужно заблокировать вообще все объекты, а затем построить укрытие, что и привело, по всей видимости, к её окончательной победе.

Что особенно впечатляет, так это то, что уже после 22 миллиона матчей агенты научились координировать свои действия и в дальнейшем эффективность их совместной работы только увеличивалась, например, каждый приносил свой ящик или стенку для создания укрытия и выбирал свою долю объектов для блокировки, чтобы усложнить игру противникам.

Механика игры позволила красной стороне (ищущим) через некоторое время придумать, как использовать заблокированные пандусы, чтобы подняться на коробки и перемещаться уже прямо на них, чтобы затем спрыгивать в построенные синими (прячущимися) укрытия

Механика игры позволила красной стороне (ищущим) спустя 388 миллионов матчей придумать, как использовать заблокированные пандусы, чтобы подняться на коробки и перемещаться уже прямо на них, чтобы затем спрыгивать в построенные синими (прячущимися) укрытия

Учёные также отметили важный момент, связанный с влиянием количества тренировочных объектов (объёмом пропускаемой через нейронную сеть данных — «Batch Size») на скорость обучения. Для модели по умолчанию требовалось 132,3 миллиона матчей в течение 34 часов обучения, чтобы достичь фазы на которой прячущаяся команда научилась блокировать пандусы, в то время как больший больший объём данных привёл к заметному сокращению времени обучения. Например, увеличение количества параметров (части данных, полученных в течении всего процесса обучения) с 0,5 млн до 5,8 млн повысило эффективность выборки в 2,2 раза, а увеличение размера входных данных в с 64 Кбайт до 128 Кбайт сократило время обучения почти в полтора раза.

Увеличение тренировочных объектов и входных данных позволило значительно сократить время обучения агентов

Увеличение тренировочных объектов и входных данных позволило значительно сократить время обучения агентов

В конце своей работы исследователи решили проверить, насколько обучение в игре может помочь агентам справляться со схожими задачами вне игры. Всего тестов было пять: осознание количества объектов (понимание, что объект продолжает существовать, даже если он находится вне видимости и не используется); «заблокировать и вернуться» — способность запомнить своё изначальное положение и вернуться к нему после выполнения какой-либо дополнительной задачи; «последовательная блокировка» — 4 ящика случайным образом были расположены в трёх комнатах без дверей, но с пандусами для попадания внутрь, агентам необходимо было найти и заблокировать их все; размещение ящиков на заранее заданных площадках; создание укрытия вокруг объекта в виде цилиндра.

В результате в трёх из пяти заданий боты, прошедшие предварительную подготовку в игре, обучались быстрее и показали лучший результат, чем ИИ, который обучался решению задач с нуля. Они немного лучше справились с выполнением задачи и возвратом на начальную позицию, последовательной блокировкой ящиков в закрытых комнатах и с размещением ящиков на заданных площадках, но показали немного более слабый результат при осознании количества объектов и созданию укрытия вокруг другого объекта.

Исследователи объясняют неоднозначный результаты в том, как ИИ получает и запоминает определённые навыки. «Мы думаем, что задачи, в которых предварительная подготовка в игре показала лучший результат, связаны с повторным использованием ранее изученных навыков привычным образом, в то время как для выполнения оставшихся задач лучше, чем обученный с нуля ИИ, потребуется использование их другим образом, что намного сложнее», — пишут соавторы работы. «Этот результат подчёркивает необходимость разработки методов эффективного повторного использования навыков полученных в результате обучения при переносе их из одной среды в другую».

Проделанная работа действительно впечатляет, так как перспектива использования данного метода обучения лежит далеко за пределом каких-либо игр. Исследователи утверждают, что их работа является значительным шагом к созданию ИИ с «физически обоснованным» и «человеческим» поведением, который сможет диагностировать заболевания, предсказывать структуры сложных белковых молекул и анализировать компьютерную томографию.

На видео ниже вы можете наглядно увидеть, как проходил весь процесс обучения, как ИИ учился командной работе, а его стратегии становились всё более хитрыми и сложными.

Microsoft инвестирует $1 млрд в компанию OpenAI

Корпорация Microsoft намерена инвестировать $1 млрд в компанию OpenAI, которая базируется в Сан-Франциско. Также было объявлено о формировании многолетнего партнёрства, направленного на развитие технологий искусственного интеллекта в облачной платформе Microsoft Azure.

Компания OpenAI была организована в 2015 году как некоммерческая организация с финансированием в $1 млрд, которые были получены от нескольких инвесторов. Ранее в этом году для привлечения внешних инвестиций была создана ещё одна некоммерческая организация.

С момента основания OpenAI привлекла немало исследователей, занимающихся разработкой технологий искусственного интеллекта. Деятельность компании связана с обучением роботизированных манипуляторов для выполнения разных задач, созданием программного обеспечения, сокращающего затраты и время на обучение роботов.

Представители OpenAI говорят о том, что инвестиции Microsoft помогут компании продолжить исследования в сфере искусственного интеллекта. В Microsoft сообщили о том, что обе компании будут совместно создавать новые технологии искусственного интеллекта на базе облачной платформы Azure. Также было отмечено, что многие сервисы компании OpenAI уже были перенесены в облачное пространство Microsoft. Кроме того, Microsoft станет «предпочтительным» партнёром для коммерциализации новых сервисов.

Официальные представители компаний предпочитают не раскрывать подробности сделки. Остаётся неизвестным, какую отдачу рассчитывает получить Microsoft от партнёрства, а также каким образом будет делиться прибыль от технологий, разработанных в процессе сотрудничества.

Искусственный интеллект OpenAI обыграл почти всех живых игроков в Dota 2

На минувшей неделе, с вечера 18 апреля и до 21 апреля, некоммерческая организация OpenAI временно открыла доступ к своим ИИ-ботам, позволяя всем желающим сыграть с ними в Dota 2. Это были те самые боты, которые ранее одержали победу над командой чемпионов мира по этой игре.

theenemy.com.br

theenemy.com.br

Как сообщается, искусственный интеллект обыграл людей с разгромным счётом. Было сыграно 7215 матчей в режиме Competitive (против игроков-людей), в которых ИИ одерживал победы в 99,4 % случаев. В 4075 случаях победа ИИ была безоговорочной, в 3140 — люди сдались сами. И только 42 матча увенчались победой живых игроков.

При этом лишь одна команда игроков смогла победить в 10 матчах. Ещё три команды смогли одержать по 3 победы подряд. Всего же за минувшие дни было сыграно свыше 35 тысяч матчей, в них участвовала почти 31 тысяча игроков. А общая продолжительность их составила 10,7 лет. Речь идёт о матчах в режимах Competitive и Cooperative. Отметим, что во втором случае живые и кибернетические игроки находились в одной команде. Это позволило использовать сильные стороны тех и других.

При этом было заявлено, что эта демонстрация OpenAI Five была последней. В будущем OpenAI планирует и дальше развивать проекты, связанные с искусственным интеллектом, однако они будут другими. Впрочем, наработки OpenAI Five и достигнутый опыт лягут в основу этих проектов.

Также было отмечено, что сложные стратегические игры, наконец, покорились ИИ, что является важной вехой в развитии будущих ИИ-технологий. Ведь долгое время считалось, что подобные игры слишком сложны для машинного интеллекта. Впрочем, то же самое говорили о шахматах и го.

Искусственный интеллект обыграл сильнейших киберспортсменов в Dota 2

В прошлом году некоммерческая организация OpenAI столкнула свою систему искусственного интеллекта с профессионалами по Dota 2. И тогда машина не смогла превзойти людей. Теперь же система взяла реванш. 

pixabay.com

pixabay.com

В Сан-Франциско на выходных прошёл чемпионат OpenAI Five, в ходе которого состоялась встреча ИИ с пятью киберспортсменами из команды OG. Эта команда в 2018 году взяла высшую награду в киберспорте, заняв первое место на турнире The International по Dota 2 с призовым фондом $25 млн. Члены команды встретились с ботами OpenAI, которых обучали по единой методике. И люди проиграли.

Сообщатся, что боты OpenAI обучались с подкреплением и независимо друг от друга. То есть они попали в игру без предварительного программирования и настроек и вынуждены были учиться методом проб и ошибок. Соучредитель и председатель OpenAI Грег Брокман (Greg Brockman) заявил, что за 10 месяцев своего существования искусственный интеллект уже сыграл 45 тысяч лет игрового процесса в Dota 2.

Что касается самой игры в Сан-Франциско, то каждый отряд имел 17 героев на выбор (всего в игре их более сотни). При этом ИИ выбрал режим, в котором каждая команда может запрещать выбор тех героев, которых выбрала сама. Это позволяет наращивать сильные стороны и минимизировать слабые. Также были отключены иллюзии и функции вызова новых героев, хотя воскрешать павших было можно.

Сообщатся, что ИИ использовал тактику, которая приводила к краткосрочной выгоде, однако она оправдалась. При этом система оживляла погибших героев даже в начале схватки. В целом же машина использовала весьма агрессивный подход, своеобразный «блицкриг», который люди не смогли отразить, поскольку первый матч продлился лишь полчаса.

Второй оказался ещё короче, поскольку ИИ разгромил людей очень быстро, акцентируясь на атаке, а не на защите. В целом же оказалось, что схема обучения с подкреплением даёт результат. Это позволит использовать её и в будущем для различных задач.

Искусственный интеллект OpenAI потягается с лучшими игроками Dota 2 на The International 2018

OpenAI рассказала о своём последнем достижении: исследовательская лаборатория натренировала команду ИИ, которая имеет шансы победить лучших игроков в Dota 2.

OpenAI в августе прошлого года впервые представила систему, которая могла бы победить лучших игроков Dota 2 в матчах «1 на 1». Однако этот режим значительно снижает сложность матча. Тогда исследователи обновили своих ботов, чтобы играть против людей в матчах «5 на 5», которые требуют координирования усилий и долгосрочного планирования. И хотя OpenAI всё ещё не бросила вызов самым лучшим игрокам, она сделает это позже в нынешнем году, на международном турнире по Dota 2, The International.

Мотивация для таких исследований проста: если мы можем научить системы искусственного интеллекта навыкам, необходимым для игры в видеоигры, мы можем использовать их для решения сложных реальных задач, которые в некотором роде выполняются тем же образом, например, управление транспортной инфраструктурой города.

Видеоигры предлагают такие испытания, которые настольные игры (шахматы или го) предложить не могут. Они скрывают информацию от пользователей — ИИ не может воспринимать всё игровое поле и рассчитывать наилучший следующий ход. В них также больше информации для обработки и огромное количество возможных шагов. Как заявляет OpenAI, в каждый момент бот, играя в Dota 2, должен выбирать между 1000 различными действиями при обработке 20000 единиц входных данных, которые представляют собой то, что происходит в матче.

Чтобы создать своих ботов, лаборатория обратилась к методу машинного обучения, известному как усиленное обучение (reinforcement learning). Это обманчиво простой метод, который может привести к сложному поведению. Агенты ИИ бросаются в виртуальную среду, где они учатся тому, как достичь своих целей путём проб и ошибок. Программисты устанавливают так называемые функции вознаграждения (начисление ботам очков за такие вещи, как убийство врага), а затем оставляют ботов играть снова и снова.

В общей сложности боты ежедневно играли 180 лет. Так они тренировались в течение нескольких месяцев. «[Сперва бот] начинает совершенно случайно блуждать по карте. Затем, через пару часов, он начинает обучаться первым базовым навыкам», — сказал сооснователь OpenAI Грег Брокман (Greg Brockman). По его словам, если человеку требуется от 12 тысяч до 20 тысяч часов игры, чтобы стать профессионалом, это означает, что агенты OpenAI «играют 100 человеческих жизней каждый день».

Хотя боты OpenAI теперь играют матчи «5 на 5», они всё ещё не подвержены полной сложности Dota 2. Существует ряд ограничений. Они играют только с помощью пяти из 115 доступных героев, каждый из которых имеет свой собственный стиль. Их выбор: Necrophos, Sniper, Viper, Crystal Maiden и Lich. Некоторые элементы их процессов принятия решений строго закодированы, например, какие предметы они покупают и какие навыки повышают. Были отключены и другие сложные участки игры, в том числе невидимость, призывы и расстановка вардов. Последние действуют как удалённые камеры и имеют важное значение в MOBA.

Агенты OpenAI также имеют все преимущества компьютера. Их скорость реакции быстрее, чем у людей, они никогда не промахиваются и у них есть мгновенный и точный доступ к таким данным, как запасы предметов, здоровье героев и расстояние между объектами на карте, которые имеют решающее значение для правильного использования определённых заклинаний.

По словам Брокмана, способность играть целые матчи в Dota 2, которые длятся в среднем 45 минут — это то, что отличает ботов OpenAI. Такое долгосрочное планирование считалось трудным или даже невозможным для обучения по используемому методу. Главная причина успешности подхода, говорит Брокман, в том, что у лаборатории имеется более мощный компьютер.

Андреас Теодору (Andreas Theodorou), исследователю ИИ в университете Бата, который использует компьютерные игры для изучения сотрудничества, говорит, что последние изучения данных по играм «5 на 5» — это большой шаг вперёд. Хотя он отмечает, что, возможно, самым значительным достижением является использование OpenAI визуализации для отладки своих агентов. «Эти методы показывают, что даже усиленное обучение и машинное обучение в целом может быть прозрачным», — сказал Теодору.

Использование исследователями отдельной функции вознаграждения ботов к совместной работе также примечательно, говорит Теодору. Она была названа Team spirit («командный дух»). Вознаграждение увеличивается каждый матч. Благодаря ей боты, начиная игру, преследуют индивидуальные цели, такие как убийства, но со временем всё больше фокусируются на общих задачах. «Боты полностью готовы пожертвовать линией или отказаться от героя для общего блага, — сказал Брокман. — Для интереса мы поместили человека, чтобы заменить одного из ботов. Мы не учили их делать что-то особенное, но он сказал, что ощущал хорошую поддержку. Боты давали всё, что он хотел».

Команда ботов OpenAI в настоящее время сыграла пять матчей против нескольких любительских и полупрофессиональных команд. Счёт 4:1 в пользу ИИ. Но самый большой вызов их ждёт позже, на The International. Смогут ли они победить лучших из лучших? Увидим уже в августе.

Илон Маск покинул совет правления OpenAI во избежание конфликта интересов с Tesla

Технологический миллиардер Илон Маск (Elon Musk) покинул совет правления OpenAI — некоммерческой организации, которую он основал вместе с президентом Y Combinator Сэмом Альтманом (Sam Altman) и которая исследует этичность и безопасность искусственного интеллекта. Маск заявил, что уходит, чтобы избежать конфликта интересов OpenAI и Tesla: последняя разрабатывает системы для самоуправляемых автомобилей, которые активно используют возможности ИИ.

Маск продолжит финансировать и консультировать OpenAI. Организация также отметила, что к её донорам присоединились генеральный директор Valve Гейб Ньюэлл (Gabe Newell), основатель Skype Яан Таллинн (Jaan Tallinn) и бывшие американский и канадский олимпийские легкоатлеты Эштон Итон (Ashton Eaton) и Брианна Тейсен-Итон (Brianne Theisen-Eaton). OpenAI продолжит расширять этот список с целью наращивания инвестиций в «людей и вычислительные ресурсы, необходимые для обеспечения последовательных прорывов в области искусственного интеллекта».

OpenAI была основана около двух лет назад и очень быстро обрела значимость в глобальном сообществе машинного обучения. Она провела исследования в самых разных областях — например, научила компьютер управлять роботами с минимальным количеством инструкций и создала ИИ, способный эффективно играть в Dota 2.

Также стоит отметить, что совсем недавно организация внесла вклад в многодисциплинарный отчёт о том, каким образом в ближайшие пять лет ИИ может быть использован злоумышленниками.

Бот OpenAI победил одного из лучших игроков в Dota 2

Во время киберспортивного турнира The International 2017 мир, возможно, узнал нового лучшего игрока по Dota 2 — правда, в лице не человека, а искусственного интеллекта. Им оказался бот исследовательской компании OpenAI, которую финансирует Элон Маск (Elon Musk). ИИ легко одержал победу над несколькими игроками, включая Даниила "Dendi" Ишутина.

Инженеры некоммерческой организации рассказали, что бот обучался всего две недели, но за этот период накопил опыт, сравнимый с «целыми жизнями». Судя по предыдущим проектам OpenAI, обучение осуществлялось с активным использованием нейронных сетей. Маск позиционирует достижение как первый случай победы искусственного интеллекта над профессионалом киберспорта.

Ишутин вышел один на один против ИИ и потерпел сокрушительное поражение. В некоторых случаях действия компьютерного игрока практически невозможно было отличить от человеческих. После двух поражений Ишутин отказался от попыток победить искусственный интеллект OpenAI. Он сказал, что «бот кажется немного человеком, но и немного чем-то другим».

Dota 2 — достаточно сложная игра, в которой две команды по пять человек пытаются уничтожить базы друг друга. В ней 113 персонажей с уникальными способностями, а также десятки предметов, улучшающих героев. Это означает, что Dota 2 имеет очень высокую вариативность — по крайней мере, для живого игрока.

Пока возможности бота OpenAI ограничены рядом трюков. Компания планирует значительно расширить его арсенал, чтобы к следующему The International ИИ мог участвовать в полноценных матчах с 10 игроками.

Алгоритм OpenAI позволяет обучить робота действию за одну демонстрацию

Некоммерческая исследовательская организация OpenAI, финансируемая Элоном Маском (Elon Musk), объявила о новом достижении в сфере развития роботов. Она создала алгоритм, который позволяет человеку обучать искусственный интеллект действиям, выполняя их в виртуальной реальности. Здесь используется метод одноразового имитационного обучения, который позволяет роботу повторять физическое действие, используя один-единственный пример.

OpenAI попыталась научить роботизированную руку складывать набор разноцветных кубиков. Человек в VR-шлеме проделывал необходимые действия в виртуальном окружении. После этого их изучала нейронная сеть, натренированная на основе сотен тысяч искусственно созданных изображений.

Поскольку сбор реальных изображений — дорого, трудно и долго, исследователи использовали искусственные картинки. OpenAI «скормила» алгоритму виртуальные образы стола и кубиков с различными фонами, эффектами освещения и текстурами. Так искусственный интеллект понимал сцену, не видев её раньше.

После этого алгоритм брал информацию из нейронной сети и отправлял её в другую, имитационную сеть. Она определяет намерения действия и повторяет его, предсказывая то, что сделал бы человек в данной ситуации. Сложность заключается в том, что расположение и цвет кубиков менялись каждый раз. Но программному обеспечению всё равно удавалось построить три столбика — каждый из двух кубов.

Роботу ни разу не показали видео или фото с реальными примерами действий. «Наш робот научился выполнять задачу, несмотря на то, что движения должны отличаться от показанных в демонстрации, — объяснил Джош Тобин (Josh Tobin), член команды OpenAI. — С помощью одной демонстрации задачи мы можем воспроизвести её в целом ряде различных начальных условий. Чтобы обучить робота, как построить другую последовательность блоков, нужна только одна дополнительная демонстрация».

Долгосрочная цель исследователей — дать искусственному интеллекту возможность быстро учиться новым действиям и адаптироваться к непредсказуемым изменениям в окружении. «Младенцы рождаются со способностью подражать тому, что делают другие люди, — говорит Тобин. — Подражание позволяет людям быстро обучаться новым действиям. Мы бы хотели, чтобы так могли обучаться и наши роботы».

Microsoft и OpenAI объединились для проведения исследований искусственного интеллекта

Подразделение Microsoft, занимающееся исследованием искусственного интеллекта, анонсировало партнёрство с некоммерческой организацией OpenAI, финансируемой Элоном Маском (Elon Musk). В рамках этой сделки OpenAI получит доступ к последним технологиям редмондской компании в области виртуальных машин и будет устраивать крупномасштабные «тренировки» искусственного интеллекта, в то время как сама Microsoft будет проводить передовые исследования на облачной платформе Azure. OpenAI, основанная в прошлом декабре Элоном Маском и президентом Y Combinator Сэмом Альтманом (Sam Altman), фокусируется на разработке ИИ, который в долгосрочной перспективе будет полезен для общества.

«Microsoft — большая технологическая компания, которая в плане демократизации технологии ИИ похожа на нас больше всего, — заявил Альтман. — Это наша самая важная цель. Мы собираемся создать очень важную технологию. Она должна будет принадлежать каждому в мире. Мы хотим, чтобы она не была сконцентрирована в рамках одного правительства и, тем более, одной компании».

Соглашение будет выгодно обеим сторонам. В OpenAI работают самые светлые умы в сфере исследования проблем, связанных с повышением разумности машин. И, как некоммерческая организация, OpenAI пообещала делиться своими знаниями и работать совместно с другими компаниями для достижения и продвижения своих целей.

Исполнительный вице-президент Microsoft AI and Research Group Гарри Шам (Harry Shum) и сопредседатель OpenAI Сэм Альтман (Sam Altman)

Исполнительный вице-президент Microsoft AI and Research Group Гарри Шам (Harry Shum) и сопредседатель OpenAI Сэм Альтман (Sam Altman)

Microsoft Research также внесла большой вклад в развитие технологий с открытым исходным кодом и совершенно не против проведения высокоуровневых исследований искусственного интеллекта на базе Azure. Это может доказать эффективность редмондского гиганта и привлечь другие компании к проведению аналогичных исследований. Более того, выгода для Microsoft здесь также заключается в том, что каждая компания, использующая Azure — это платёжеспособный клиент. В более широком масштабе Microsoft надеется стать полноценным конкурентом Google и Facebook, которые инвестировали в развитие искусственного интеллекта миллиарды долларов. 

window-new
Soft
Hard
Тренды 🔥