Теги → deepmind
Быстрый переход

В DeepMind AI научили нейросеть решать любые задачи по программированию

Инженеры подразделения Alphabet DeepMind AI рассказали о создании системы искусственного интеллекта (ИИ) AlphaCode, которая способна генерировать код и решать задачи, предлагаемые на чемпионатах по программированию. Для этого нейросеть обучили двум языковым навыкам: пониманию постановки задачи и поиску её решения.

 Источник изображения: Christopher Gower / unsplash.com

Источник изображения: Christopher Gower / unsplash.com

Сегодня существуют системы, способные решать отдельные задачи, генерируя программный код, однако эти решения не носят универсального характера: обученный одному классу задач ИИ с большой вероятностью терпит неудачу, когда условия задачи кардинально меняются. Поэтому инженеры Google применили несколько иной подход, положив, что описание задачи — это выражение того, что должен делать алгоритм, а её решение — то же самое, но изложенное на другом языке. Поэтому при обучении системы исследователи решили достичь двух целей: сначала ИИ должен усвоить описание задачи, а затем — на основании своего внутреннего представления создать программный код.

В качестве источника данных выступил архив GitHub с более чем 700 Гбайт кода, которые перемежались с комментариями на естественном языке, поясняющими его работу. После первого этапа обучения система перешла к этапу настройки: в DeepMind организовали внутренний чемпионат по программированию, материалы которого также «скормили» ИИ. В этих материалах был полный цикл: постановка задачи, работающий и неработающий код, а также тестовые примеры для его проверки. Подобный подход применялся и раньше, но на сей раз инженеры выделили значительно больше ресурсов на обучение — «на порядки больше, чем в предыдущей работе».

 Источник изображения: Procreator / unsplash.com

Источник изображения: Procreator / unsplash.com

На начальном этапе результат был далёк от идеала: более 40 % предлагаемых нейросетью решений либо требовали слишком больших аппаратных ресурсов, либо решение задачи занимало слишком много времени. Проводя анализ кода, создатели системы обнаружили, что при решении различных задач, даже если программа выдавала правильный результат, система часто использовала схожие фрагменты кода, выдающие одинаковые ответы при одинаковых исходных данных. Отфильтровав некорректные варианты, AlphaCode смогла выступать на уровне программистов с опытом работы от нескольких месяцев до года, войдя в число справившихся с задачами 54 % конкурсантов на чемпионате.

Такого результата удалось достичь, введя автоматизированную проверку по 100 тыс. предлагаемых системой решений — увеличение этого числа приводило к пропорциональному росту доли правильных ответов. Но пропорционально же росла и ресурсоёмкость вычислительной системы: первоначально для её обучения потребовался объём энергии, в 16 раз превышающий годовую потребность средней американской семьи.

Учёные сделали вывод, что система действительно научилась работать, как и было задумано, предлагая корректные решения, а не случайные фрагменты кода «в надежде», что какой-то из них сработает. Однако при усложнении условий значительно растёт ресурсоёмкость, а значит, сегодня услуги настоящих программистов по-прежнему востребованы, хотя и открываемые ИИ перспективы тоже заслуживают внимания.

Игровой ИИ AlphaZero открыл новый способ умножения матриц впервые за 50 лет

Разработанная компанией DeepMind система искусственного интеллекта AlphaZero, первоначально предназначенная для настольных игр, предложила более быстрый способ умножения матриц — фундаментальной математической задачи, для которой не находилось новых решений уже более 50 лет.

 Источник изображения: technologyreview.com

Источник изображения: technologyreview.com

Задача об умножении матриц лежит в основе самых разных приложений от вывода изображения на экран до моделирования сложной физики, а также обучения самого искусственного интеллекта. Оптимизация решения этой задачи помогла бы упростить выполнение множества компьютерных операций, сократив расходы и обеспечив экономию энергии. Несмотря на повсеместное распространение задачи, она до сих пор недостаточно изучена.

Матрица — это массив чисел, а умножение матриц — это обычно последовательное умножение чисел в строках одной на числа в столбцах другой. Задача кажется относительно простой, но она существенно усложняется при попытке найти ускоренный метод её решения, и это одна из открытых проблем в информатике. Предполагается, что число доступных способов умножения матриц превосходит количество атомов во вселенной — в некоторых случаях до 10³³ вариантов.

Чтобы «заинтересовать» нейросеть AlphaTensor, новую версию AlphaZero, задачу об умножении матриц превратили в своего рода настольную игру, каждое действие умножения сопоставили игровому ходу, а ИИ получал награду за победу с минимальным числом ходов. В результате AlphaTensor нашёл новый способ умножения матриц 4×4, более эффективный, чем в 1969 году предложил немецкий математик Фолькер Штрассен (Volker Strassen). Базовый способ предполагает решение задачи за 64 шага, у Штрассена это 49 шагов, а AlphaTensor справляется за 47. В целом ИИ усовершенствовал алгоритмы для матриц более 70 размеров: при размере 9×9 число шагов уменьшилось с 511 до 498, а при 11×11 — с 919 до 896. В ряде других случаев AlphaTensor повторил лучшие из известных алгоритмов.

Получив результаты, инженеры DeepMind решили адаптировать их для ускорителей NVIDIA V100 и Google TPU, которые чаще всего используются в машинном обучении. Выяснилось, что предложенные AlphaTensor методы работают на 10–20 % быстрее традиционных.

DeepMind разработала нейросеть, способную реставрировать древнегреческие тексты

Принадлежащая Google лаборатория DeepMind уже обучила искусственный интеллект управлять термоядерными реакторами и программировать не хуже среднестатистических людей-специалистов, а теперь разработчики решили освоить новую сферу — использовать ИИ в прикладной археологии. Компания сможет реставрировать древние тексты с высокой степенью точности.

 Источник изображения: ithaca.deepmind.com

Источник изображения: ithaca.deepmind.com

Новый инструмент DeepMind позволит не только восстанавливать утраченные части древних текстов, но и определять их происхождение, а также датировку. Для этого компания объединила усилия с историками и учёными из Италии, Франции, Греции и натренировала ИИ на крупнейшей базе древнегреческих текстов.

В результате был создан ИИ Ithaca. Инструмент способен восстанавливать повреждённые тексты с точностью порядка 62 %, идентифицировать их место происхождения с точностью до 71 % и датировать тексты с точностью до 30 лет.

 Источник изображения: ithaca.deepmind.com

Источник изображения: ithaca.deepmind.com

Известно, что эксперты достигли 25 % точности при восстановлении документов «вручную», а с помощью Ithaca комбинированные усилия позволяют повысить точность до почти 72 % — искусственный интеллект на каждый отсутствующий фрагмент предлагает несколько вариантов на выбор экспертов — сотрудничество человека и машины обещает более достоверные результаты.

По данным DeepMind, лаборатория уже работает над тренировкой ИИ для работы с другими древними языками вроде иврита, демотического письма или языка майя. Ithaca доступна как формате ПО с открытым исходным кодом, так и виде бесплатного веб-сервиса. С фрагментами древнегреческого текста специалисты могут поэкспериментировать непосредственно на сайте.

DeepMind разработала нейросеть AlphaCode, способную дать фору начинающим и средним программистам

Компания DeepMind создала платформу искусственного интеллекта AlphaCode, не только отчасти способную программировать вместо человека, но и готовую делать это на «конкурентоспособном» уровне. Дочернее предприятие Alphabet протестировало систему на задачах, используемых в состязаниях программистов-людей.

 Источник: Innovalabs/pixabay.com

Источник: Innovalabs/pixabay.com

Выяснилось, что по результатам испытаний ИИ входит в число 54 %, справившихся с задачами лучше всех. Результат стал большим шагом вперёд на пути к созданию автономных систем программирования, хотя навыки AlphaCode не обязательно соответствуют задачам, стоящим перед среднестатистическим кодером.

По данным DeepMind, исследования пока находятся на ранней стадии, но уже сейчас понятно, что программа может автономно решать задачи по программированию, до недавних пор доступные только людям. В компании рассчитывают, что в долгосрочной перспективе ИИ будет помогать разработчикам писать код, улучшая производительность сотрудников и предлагая новые способы разработки программного обеспечения.

AlphaCode протестировали на платформе Codeforces, на которой еженедельно публикуются задачи по программированию и рейтинг программистов. Задачи отличаются от тех, с которыми может столкнуться программист, создавая, например, коммерческое приложение. Они более «самодостаточны» и требуют широких знаний как алгоритмов, так и теоретических концепций информатики. Для их решения требуется комбинированный подход, поскольку программисту необходимо разбираться в логике, математике и собственно программировании.

Одним из примеров является задание, в котором необходимо найти способ преобразовать одну строку произвольно повторяющихся букв s и t в другую строку тех же символов, используя ограниченное число нажатий клавиш. При этом конкурсанты не могут, например, просто печатать новые буквы вместо старых — вместо этого нужно воспользоваться клавишей Backspace и удалить несколько букв исходной строки. Задание относится к примерам средней сложности, слева на изображении содержится её описание, справа — образцы.

 Источник: DeepMind/Codeforces

Источник: DeepMind/Codeforces

Десять подобных задач поручили выполнить AlphaCode точно так же, как их поручают выполнить людям. ИИ сгенерировал некоторое количество возможных решений и отсеял непригодные, запуская код и проверяя результат — так же, как это сделал бы программист.

10 задач, предложенных AplphaCode, выполнялись 5 тысячами программистами на сайте Codeforces. Работа ИИ попала в лучшие 54,3 % ответов, а по данным DeepMind это обеспечивает AlphaCode рейтинг Codeforces Elo на уровне 1238. Таким образом, ИИ вошёл в число лучших 28 % программистов, соревновавшихся на площадке за последние полгода.

В DeepMind отмечают, что текущие навыки AlphaCode применимы только на площадках для соревнований программистов, но в теории новая система позволяет создавать инструменты, способные сделать программирование более доступным и, когда-нибудь, полностью автоматизированным.

 Источник: DeepMind

Источник: DeepMind

Известно, что над аналогичными решениями работают многие другие компании. Большой прогресс был достигнут в последние годы, но все эти системы пока далеки от того, чтобы занять место программистов-людей. Выпускаемый ИИ код часто полон багов, а поскольку такие системы обычно обучаются на библиотеках общедоступного кода, иногда они воспроизводят фрагменты, защищённые авторским и смежными правами.

Более того, в одном из исследований выяснилось, что программа Copilot, разработанная репозиторием кода GitHub, создавала код, 40 % которого содержало уязвимости. Специалисты по информационной безопасности даже предположили, что злоумышленники могут намеренно писать и выкладывать в общий доступ код с бэкдорами, который позже будет использоваться для тренировки ИИ-систем, в результате обречённых допускать ошибки в своих будущих решениях.

Перечисленные проблемы означают, что системы ИИ-программирования, скорее всего, будут медленно интегрироваться в работу обычных программистов до тех пор, пока не «заслужат» доверие. Другими словами, им ещё предстоит учиться и учиться. Но делают это они очень быстро.

Alphabet основала компанию, которая будет искать новые лекарства с помощью искусственного интеллекта

Холдинг Alphabet объявил в четверг об основании новой компании, которая будет использовать технологии искусственного интеллекта для открытия новых лекарств. Она будет использовать наработки DeepMind, ещё одной дочерней компании Alphabet, которая проделала революционную работу с использованием ИИ для предсказания структуры белков.

 Источник изображения: The Verge

Источник изображения: The Verge

Новая компания, получившая название Isomorphic Laboratories, будет использовать эти достижения для создания инструментов, которые помогут открыть новые фармацевтические препараты. Генеральный директор DeepMind Демис Хассабис (Demis Hassabis) будет выполнять функции гендиректора Isomorphic Laboratories, но обе компании будут оставаться независимыми друг от друга, время от времени сотрудничая.

В течение многих лет эксперты указывали на ИИ как способ ускорить и удешевить поиск новых лекарственных препаратов. ИИ может помочь сканировать базы данных молекул, чтобы найти те, которые лучше всего подходят для конкретной цели. Isomorphic попытается построить модели, которые могут предсказать, как лекарства будут взаимодействовать с организмом. Она будет использовать работу DeepMind в области структуры белков, чтобы выяснить, как несколько белков могут взаимодействовать друг с другом. Компания будет сосредоточена на развитии партнёрских отношений с фармацевтическими компаниями.

Однако разработка и тестирование лекарств могут оказаться более сложной задачей, чем определение структуры белка. Кандидат на роль лекарства, который выглядит многообещающим, исходя из того, как он действует на химическом уровне, может не всегда работать на практике. Отмечается, что более 90 % лекарств, прошедших клинические испытания, в конечном итоге не работают. Работа DeepMind и Isomorphic Laboratories может помочь преодолеть некоторые узкие места в исследованиях, но она не является быстрым решением всех проблем, связанных с разработкой лекарств.

Лаборатория искусственного интеллекта DeepMind, входящая в состав Alphabet, впервые принесла прибыль

Исследовательская лаборатория искусственного интеллекта DeepMind, входящая в состав холдинга Alphabet, впервые принесла прибыль. Об этом стало известно из отчёта компании, опубликованного во вторник в реестре компаний Великобритании.

 DeepMind

DeepMind

Базирующаяся в Лондоне исследовательская фирма сообщила о прибыли в размере £43,8 млн ($59,6 млн), полученной в 2020 году, после того, как последние несколько лет она отчитывалась об убытках в сотни миллионов долларов. Оборот DeepMind вырос за год более чем в три раза — с £265,5 млн в 2019 году до £826,2 млн в 2020 году, согласно отчётам, поданным в Регистрационную палату Великобритании. Впрочем, DeepMind не раскрыла конкретную причину столько резкого роста доходов.

DeepMind не реализует свои продукты напрямую потребителям, и не объявляла о каких-либо сделках с частными компаниями вне Alphabet. Вместе с тем она поставляет программное обеспечение и оказывает услуги компаниям холдинга, включая Google, YouTube и X (moonshot factory).

Представитель DeepMind сообщил ресурсу CNBC, что компания «поддерживает продукты и инфраструктуру, которые обогащают жизнь миллиардов людей благодаря многочисленным совместным проектам, над которыми она работала в рамках Alphabet на протяжении многих лет».

«Я не думаю, что DeepMind имеет много или какие-либо потоки доходов, — сообщил источник CNBC, попросив сохранить анонимность. — Таким образом, весь этот доход зависит от того, сколько Alphabet платит за внутренние услуги, и это может производиться совершенно произвольно».

DeepMind не уточнила, сколько человек добавила в свою команду в 2020 году, но сообщила, что теперь в ней работает более 1000 сотрудников. В прошлом году её персонал насчитывал около 1000 человек, то есть он вырос незначительно. Также незначительно выросли затраты на персонал и другие связанные с этой статьёй расходы — с £467 млн до £473 млн. В DeepMind работают ведущие мировые учёные-исследователи искусственного интеллекта, годовая зарплата которых превышает $1 млн.

ИИ Google готов решить величайшую проблему в биологии за последние 50 лет — представить форму всех известных науке белков

Последовательности аминокислот при соединении друг с другом сворачиваются в сотни миллионов причудливых белковых форм, предсказать которые было невозможно — только изучить в лаборатории. Прогресс наметился с приходом в биологию технологий ИИ, а сейчас готовится прорыв — структура DeepMind компании Google обещает вскоре представить форму всех известных науке белков, что кратно ускорит поиск новых лекарств и приведёт к другим открытиям в биологии.

 Источник изображения: DeepMind

Источник изображения: DeepMind

Компания DeepMind пока не может уйти от Google, но обещает создать открытую базу по всем предсказанным белковым формам. Произойдёт это в течение нескольких месяцев и обещает стать самым грандиозным в истории биологии событием. Программы по предсказанию формы белка разрабатываются многими компаниями и научными коллективами, но пакет AlphaFold DeepMind показал самую высокую точность прогнозирования формы. Эти инструменты находятся в открытом доступе, а готовая база данных по белкам значительно облегчит работу биологов во всём мире — бери и пользуйся.

Пакет AlphaFold может предсказывать форму белков с точностью до атома. Но даже меньшая точность позволяет разрабатывать новые лекарства, предоставляя информацию о приблизительной пространственной конфигурации ранее структурно не изученных белков. Так, если за последние 10 лет биологи смогли изучить строение только 17 % белков человека, то AlphaFold за считанные недели удвоил базу белковых форм человека до 36 %. Эту информацию ещё предстоит проверить, но раньше алгоритм AlphaFold уже доказывал свою способность почти не ошибаться.

Кроме белков человека DeepMind обещает представить белковые формы 20 наиболее изученных организмов от дрожжей до мух дрозофил, мышей и других — до сотен миллионов белковых форм. Сегодня база DeepMind содержит информацию о 350 тыс. предсказанных формах белка, но через несколько месяцев будет расширена до более чем 100 млн форм, где будут почти все более или менее известные науке белки. Изучению пока не поддаются белки, которые принимают пространственную форму при соединении с другими белками, но это будет следующий орешек для ИИ.

DeepMind проиграла битву с Google за независимость — IT-гигант хочет окупить свои инвестиции в компанию

Переговоры о независимости одного из крупнейших исследователей искусственного интеллекта DeepMind от материнской компании Google завершились ничем. Корпорация отклонила просьбу дочерней компании о большей автономности и признании её некоммерческой структурой. Об этом пишет The Wall Street Journal со ссылкой на осведомлённые источники.

 YouTube

YouTube

Как пишет журналист Парми Олсон (Parmy Olson), переговоры между сторонами завершились в прошлом месяце. DeepMind предлагала юридически сделать структуру компании похожей на некоммерческую организацию. Она аргументировала инициативу тем, что искусственный интеллект не должен контролироваться одним юридическим лицом. Представители Google не согласились с этим утверждением, заявив, что это не имеет смысла, учитывая сколько средств было вложено в DeepMind.

Всё дело в том, что Google публично утверждает, что её будущее — за искусственным интеллектом. IT-гигант владеет DeepMind с 2014 года и покрывает её многомиллионные убытки. Согласно отчётам за 2019 год, убыточность компании достигла около $660 миллионов. Взамен требуют монетизации и коммерциализации деятельности исследователей. Это привело к запуску проектов по улучшению времени автономной работы Android и снижения энергопотребления в центрах обработки данных Google.

Как отмечает Олсон, ещё одним предметом противостояния стало обещание Google создать этический совет, который будет отвечать за честное применение ИИ, однако точные параметры отбора в этот совет не уточнялись. Журналист подчёркивает, что дальнейшая работа DeepMind будет контролироваться советом по анализу передовых технологий (Advanced Technology Review Council), который в основном состоит из топ-менеджеров Google.

ФК «Ливерпуль» и DeepMind изучают возможность использования нейросетей в футболе

Стало известно, что футбольный клуб «Ливерпуль» объединил усилия с командой разработчиков принадлежащей Alphabet компании DeepMind с целью изучить возможности использования искусственного интеллекта в мире футбола. Результаты совместной работы опубликованы в журнале Journal of Artificial Intelligence Research.

В последние годы объём данных, доступных в футболе, значительно увеличился за счёт разнообразных датчиков, GPS-трекеров и алгоритмов компьютерного зрения, которые используются для слежения за движением мяча и перемещениями игроков по полю. Обилие данных означает, что для их анализа могут использоваться передовые технологии.

Исследование показало, что футбольные команды могут использовать нейронные сети для выявления закономерностей, которые не может заметить тренер. Отмечается, что футбол предлагает для DeepMind ограниченную, но сложную среду для тестирования алгоритмов. «Игра, подобная футболу, очень интересна, потому что здесь много агентов, есть аспекты конкуренции и сотрудничества. В отличие от шахмат или го, футболу присуща неопределённость, потому что в него играют в открытом мире», — считает один из исследователей из DeepMind Карл Туйлс (Karl Tuyls).

Неопределённость не означает, что нельзя делать прогнозы в футболе, и это одна из областей, где ИИ-алгоритм может оказаться наиболее полезным. Например, можно обучить нейросеть на данных о конкретной команде и составе, чтобы предсказывать, как игроки будут реагировать в разных ситуациях на поле. Такой алгоритм сможет прогнозировать последствия тактических изменений или того, как, например, будет играть соперник, в случае, если ключевой игрок покинет поле из-за травмы.

Цель исследования не в том, чтобы создать замену тренерам, а в том, чтобы создать дополнительный инструмент. «Есть большое количество данных, которые алгоритм должен переварить, и обрабатывать массивы таких данных не всегда просто. Мы пытаемся создать вспомогательную технологию», — говорят исследователи. Нейросеть также могла бы использоваться для прогнозирования того, как тот или иной игрок будет бить пенальти. Ещё один вариант использования нейросетей в футболе заключается в оценке влияния конкретных действий игроков в той или иной ситуации на конечный результат. Такая информация была бы полезна для послематчевого анализа.

«Цель состоит в том, чтобы иметь целостную систему, которая хорошо интегрируется с игроком-человеком на поле и облегчает его работу. Я не думаю, что вы увидите большие достижения в следующие полгода или год, но в следующие пять лет некоторые инструменты будут сильнее развиты и вы увидите появление чего-то вроде «Автоматизированного видеопомощника для тренера», который поможет проводить предматчевый и послематчевый анализ», — считает Карл Туйлс.

ИИ DeepMind Agent57 проходит игры Atari лучше человека

Заставить нейронную сеть проходить несложные видеоигры — идеальный способ проверить эффективность её обучения благодаря простой возможности оценивать результаты прохождения. Разработанный в 2012 году компанией DeepMind (часть холдинга Alphabet) эталонный тест из 57 каноничных игр Atari 2600 стал лакмусовой бумажкой для проверки возможностей самообучающихся систем. И вот Agent57, передовой RL-агент (Reinforcement Learning — обучение с подкреплением) DeepMind, на днях показал огромный скачок по сравнению с предыдущими системами и стал первой итерацией ИИ, превосходящей базовые показатели игрока-человека.

 J - показатель RL-агента Agent57

J - показатель RL-агента Agent57

ИИ Agent57 учитывает опыт предыдущих систем компании и объединяет алгоритмы эффективного исследования среды с мета-контролем. В частности, Agent57 доказал свои сверхчеловеческие навыки в Pitfall, Montezuma's Revenge, Solaris и Skiing — играх, которые были серьезным испытанием для предыдущих нейросетей. Согласно результатам исследований, для достижения лучших результатов Pitfall и Montezuma's Revenge заставляют ИИ больше экспериментировать. Solaris и Skiing сложны для нейросетей, потому что признаков успеха не так много — ИИ в течение длительного времени не знает, совершает ли он правильные действия. DeepMind основывалась на своих старых агентах ИИ, чтобы Agent57 мог принимать более правильные решения в отношении исследования среды и оценки результатов прохождение игр, а также оптимизировать компромисс между краткосрочным и долгосрочным поведением в таких играх как Skiing.

Результаты впечатляют, но ИИ ещё предстоит пройти долгий путь. Эти системы могут справиться только с одной игрой за раз, что, по словам разработчиков, противоречит возможностям человека: «Истинная гибкость, которая так легко даётся человеческому мозгу, всё ещё находится за пределами досягаемости ИИ».

Соучредитель DeepMind Мустафа Сулейман перешёл в Google

Кадровые перестановки в Alphabet продолжаются — на этот раз один из трёх соучредителей влиятельной ИИ-лаборатории DeepMind Мустафа Сулейман (Mustafa Suleyman) переходит в Google. Он сообщил в Twitter, что после замечательного десятилетия в DeepMind присоединится к Google, чтобы работать с главой отдела искусственного интеллекта Джеффом Дином (Jeff Dean) и её главным юрисконсультом Кентом Уокером (Kent Walker). Чем конкретно будет заниматься новый руководитель — ещё не объявлено, но представитель компании сказал, что это будет связано с работой над стратегией в области ИИ.

В начале этого года сообщалось, что DeepMind уволит Мустафу Сулеймана. Компания поспешила опровергнуть эти сообщения, заявив, что это было обоюдное решение, призванное предоставить господину Сулейману отдых после 10 лет напряжённой работы. Некоторые предположили, что уход руководителя стал результатом напряженных отношений между DeepMind и Google в попытках первой коммерциализировать свою технологию.

Несмотря на то, что DeepMind добилась целого ряда исследовательских прорывов в мире искусственного интеллекта, среди которых, например, успех программы AlphaGo, лаборатория также понесла значительные финансовые потери. В 2018 году она удвоила свои доходы до $135 млн, но расходы тоже выросли до $618 млн, а общий долг компании составил более $1,3 млрд.

Мустафа Сулейман, основавший DeepMind в 2010 году вместе с нынешним исполнительным директором Демисом Хассабисом (Demis Hassabis) и текущим главным научным сотрудником Шейном Леггом (Shane Legg), возглавил команду здравоохранения, которая предложила лаборатории путь для монетизации своих исследований. Инженеры DeepMind разработали ряд алгоритмов, которые открыли новые возможности в области здравоохранения, а его команда создала приложение-помощник для медсестёр и врачей, которое обещало сэкономить время и деньги. Но подразделение подверглось резкой критике за неправильное обращение с медицинскими данными в Великобритании и в 2018 году было поглощено Google Health.

Помимо этого, Мустафа Сулейман возглавил команду «DeepMind для Google», которая стремилась задействовать исследования компании для практического использования в продуктах Google, предоставляя ощутимые коммерческие преимущества, такие как увеличение времени автономной работы на устройствах Android и более естественный голос для Google Assistant.

Без более подробной информации о новой роли господина Сулеймана последствия его перехода в Google ещё не вполне ясны. Как подчеркивает Демис Хассабис в своей публикации, приуроченной к объявлению об уходе Мустафы Сулеймана, DeepMind всё ещё работает над тем, как позиционировать себя в будущем. Он обрисовал DeepMind от сомнительного стартапа до крупной научной организации. И хотя выделил сотрудничество лаборатории с другими подразделениями Alphabet, основное внимание сосредоточил на фундаментальных прорывах и больших задачах, которые DeepMind надеется решить, используя искусственный интеллект. Очевидно, что долгосрочные исследования, а не краткосрочная прибыль, по-прежнему остаются приоритетом для учёных DeepMind.

Blizzard добавит искусственный интеллект AlphaStar в рейтинговый режим StarCraft II

Компания Blizzard добавит экспериментальную версию искусственного интеллекта AlphaStar от компании DeepMind в рейтинговый режим StarCraft II. Согласно заявлению на сайте студии, он будет добавлен на ограниченное количество матчей. Тестирование пройдёт на европейском сервере.

AlphaStar анонимно сыграет ряд матчей с игроками. Пользователи не будут знать, что они сражаются с искусственным интеллектом. На ИИ будут наложены определённые ограничения, которые были введены после общения с профессиональными игроками. Никаких уникальных наград за победу над нейросетью не будет — в зависимости от победы или поражения рейтинг изменится так, как и в обычном матче.

Разработчики рассказали, что решили запустить ИИ анонимно в целях объективности эксперимента. На платформе StarCraft II будет протестировано несколько версий AlphaStar, чтобы всесторонне оценить работу нейросети. После окончания эксперимента компания опубликует записи матчей.

В январе 2019 года DeepMind и Blizzard провели серию шоу-матчей между ИИ AlphaStar и профессиональными игроками в StarCraft II. Сначала нейросеть одержала победу со счётом 10:0, но на используемую версию бота не действовал туман войны, что позволяло ему наблюдать за действиями киберспортсменов. Версия без этой функции уступила Гжегожу MaNa Коминчу со счётом 0:1.

ИИ DeepMind освоил командную игру и превзошёл человека в Quake III

Захват флага — достаточно простой соревновательный режим, реализованный во многих популярных шутерах. У каждой команды есть некий маркер, расположенный на её базе, и цель состоит в том, чтобы захватить маркер соперников и успешно доставить его к себе. Однако то, что легко понимают люди, не так легко даётся машинам. Для захвата флага неигровые персонажи (боты) традиционно программируются с помощью эвристики и несложных алгоритмов, предоставляющих ограниченную свободу выбора и значительно уступающие людям. Но искусственный интеллект и машинное обучение обещают полностью перевернуть эту ситуацию.

В статье, опубликованной на этой неделе в журнале Science примерно через год после препринта, а также в своём блоге, исследователи из DeepMind, лондонской дочерней компании Alphabet, описывают систему, способную не только научиться играть в захват флага на картах Quake III Arena от id Software, но и разрабатывать совершенно новые командные стратегии, ни в чём не уступая человеку.

 Игроки, обучающие ИИ игре на ранних этапах исследования

Игроки обучают ИИ на ранних этапах исследования. Первоначально для обучения использовались карты Quake III с упрощённым дизайном уровней

«Никто не рассказал ИИ, как играть в эту игру, у него был только результат — победил ИИ своего противника или нет. Прелесть использования подобного подхода в том, что вы никогда не знаете, какое поведение возникнет при обучении агентов», — рассказывает Макс Джадерберг (Max Jaderberg), научный сотрудник DeepMind, который ранее работал над системой машинного обучения AlphaStar (недавно она превзошла человеческую команду профессионалов в StarCraft II). Далее он объяснил, что ключевой метод их новой работы — это, во-первых, усиленное обучение, которое использует своеобразную систему наград для подталкивания программных агентов к выполнению поставленных целей, причём система наград работала независимо от того, выиграла команда ИИ или нет, а во-вторых, обучение агентов производилось в группах, что принуждало ИИ осваивать командное взаимодействие с самого начала.

«С исследовательской точки зрения это новинка для алгоритмического подхода, которая действительно впечатляет, — добавил Макс. Способ, которым мы обучали наш ИИ, хорошо показывает, как масштабировать и реализовать некоторые классические эволюционные идеи».

 Схема агентской архитектуры For The Win (FTW). Агент объединяет повторяющиеся нейронные сети (RNN) в быстрых и медленных временных масштабах, включает в себя модуль общей памяти и изучает преобразование игровых очков во внутреннее вознаграждение.

Схематичное изображение архитектуры агентов FTW. Агент объединяет две рекуррентные нейронные сети (RNNs) для быстрых решений и медленного анализа, включает в себя модуль общей памяти и изучает преобразование игровых очков во внутреннее вознаграждение

Агенты DeepMind, получившие вызывающее название — For The Win (FTW), учатся непосредственно на экранных пикселях, используя свёрточную нейронную сеть, набор математических функций (нейронов), расположенных в слоях, смоделированных по аналогии со зрительной корой мозга человека. Полученные данные передаются в две сети с многократной кратковременной памятью (англ. long short-term memory — LSTM), способные распознавать долгосрочные зависимости. Одна из них управляет оперативными данными с быстрой скоростью реакции, а другая работает медленно для анализа и формирования стратегий. Обе связаны с вариационной памятью, которую они совместно используют для прогнозирования изменений игрового мира и выполнения действий через эмулируемый игровой контроллер.

 Посмотрите, как наши агенты представляют игровой мир. На приведенном выше графике паттерны нейронной активации в данный момент времени показаны в зависимости от того, насколько они похожи друг на друга: чем ближе две точки находятся в пространстве, тем больше сходны паттерны их активации. Затем они раскрашиваются в соответствии с игровой ситуацией в то время - тот же цвет, та же ситуация. Мы видим, что эти паттерны нейронной активации организованы и образуют цветные кластеры, что указывает на то, что агенты представляют значимые аспекты игрового процесса в стереотипной, организованной форме. Обученные агенты даже демонстрируют некоторые искусственные нейроны, которые кодируют непосредственно для конкретных ситуаций.

Как ИИ видит игровой мир? Паттерны нейронной активации показаны в зависимости от того, насколько они похожи друг на друга: чем ближе две точки находятся в пространстве, тем вероятнее применение одного и того же паттерна. Паттерны организованы и образуют цветные кластеры, что указывает на то, что агенты представляют значимые аспекты игрового процесса в стереотипной, организованной форме. Обученные агенты даже демонстрируют некоторые искусственные нейроны, которые кодируют конкретные игровые ситуации

В общей сложности DeepMind обучила 30 агентов, учёные дали им ряд товарищей по команде и противников, с которыми можно было играть, а игровые карты выбирались случайным образом, чтобы ИИ не запоминал их. Каждый агент имел свой собственный сигнал вознаграждения, позволяющий ему создавать свои внутренние цели, например, захват флага. Каждый ИИ по отдельности сыграл около 450 тыс. игр на захват флага, что эквивалентно примерно четырём годам игрового опыта.

Полностью обученные агенты FTW научились применять стратегии, общие для любой карты, списка команд и их размеров. Они обучились человеческому поведению, такому как следование за товарищами по команде, размещение в лагере на базе противника и защита своей базы от нападающих, а также они постепенно утратили менее выгодные модели, например, слишком внимательное наблюдение за союзником.

Прогресс навыков ИИ в процессе обучения. Примерно после 225 тыс. игр агенты сравнялись в навыках и рейтинге Эло с профессиональными игроками

Так каких же удалось добиться результатов? В турнире с участием 40 человек, в котором люди и агенты случайным образом играли как вместе, так и друг против друга, агенты FTW значительно превзошли коэффициент побед у игроков-людей. Рейтинг Эло, который соответствует вероятности выигрыша, у ИИ составил 1600, по сравнению с 1300 у «сильных» игроков-людей и 1050 у «среднего» игрока-человека.

 Создание искусственной задержки в скорости реакции не дало людям преимущества перед ИИ

Создание искусственной задержки в скорости реакции не дало людям преимущества перед ИИ

Это не удивительно, так как скорость реакции ИИ значительно выше, чем у человека, что давало первому значимое преимущество в первоначальных экспериментах. Но даже когда точность агентов была уменьшена, а время реакции увеличено благодаря встроенной задержке в 257 миллисекунд, ИИ всё равно превзошёл людей. Продвинутые и обычные игроки выиграли только 21 % и 12 % игр от общего числа соответственно.

Навыки ИИ оказались применимы и к полноценным картам Quake III, а не только к упрощённым, которые использовались для обучения

Более того, после публикации исследования учёные решили испытать агентов на полноценных картах Quake III Arena со сложной архитектурой уровней и дополнительным объектами, таких как Future Crossings и Ironwood, где ИИ начал успешно оспаривать первенство людей в тестовых матчах. Когда исследователи изучили схемы активации нейронных сетей у агентов, то есть функции нейронов, ответственных за определение выходных данных на основе входящей информации, они обнаружили кластеры, представляющие собой комнаты, состояние флагов, видимость товарищей по команде и противников, присутствие или отсутствие агентов на базе противника или на базе команды, и другие значимые аспекты игрового процесса. Обученные агенты даже содержали нейроны, которые кодировали непосредственно конкретные ситуации, например, когда флаг взят агентом или когда его держит союзник.

«Я думаю, что одна из вещей, на которые стоит обратить внимание, заключается в том, что эти многоагентные команды являются исключительно мощными, и наше исследование демонстрирует это, — говорит Джадерберг. — Это то, что мы учимся делать лучше и лучше за последние несколько лет — как решить проблему обучения с подкреплением. И обучение с подкреплением действительно показало себя блестяще».

Тор Грэпел (Thore Graepel), профессор компьютерных наук в Университетском колледже Лондона и ученый из DeepMind, уверен, что их работа подчёркивает потенциал многоагентного обучения для развития ИИ в будущем. Также она может послужить основой для исследований взаимодействия человека с машиной и систем, которые дополняют друг друга или работают вместе.

«Наши результаты показывают, что многоагентное обучение с подкреплением может успешно освоить сложную игру до такой степени, что игроки-люди даже приходят к мнению, что компьютерные игроки — лучшие товарищи по команде. Исследование также предоставляет крайне интересный углубленный анализ того, как обученные агенты ведут себя и работают вместе, рассказывает Грэпел. Что делает эти результаты такими захватывающими, так это то, что эти агенты воспринимают своё окружение от первого лица, [то есть] так же, как человек-игрок. Чтобы научиться играть тактически и сотрудничать со своими товарищами по команде, эти агенты должны были полагаться на обратную связь с результатами игры, без какого-либо учителя или тренера, показывающего им, что нужно делать».

Машины атакуют: ИИ от DeepMind превзошёл профессиональных игроков в StarCraft II

StarCraft II ещё с ноября 2016 года стала площадкой для экспериментов сотрудников DeepMind (подразделение Alphabet) в области искусственного интеллекта. В августе 2017 года DeepMind вместе с Blizzard позволили исследовать ИИ с помощью StarCraft II всем желающим в открытом окружении, выпустив ряд новых инструментов. В ноябре того же года в Сеуле, в Университете технологии и науки Южной Кореи был проведён турнир между профессионалами и ИИ в этой RTS. Тогда люди всё ещё оказались лучше машин, но прогресс не стоит на месте, так что теперь даже самым изощрённым корейским игрокам есть о чём переживать при игре против компьютера.

Люди склонны считать, что весьма искусны в играх, которые создают, но компьютеры снова и снова доказывают, что человеческий разум и его реакция попросту недостаточно быстры, чтобы совладать с вычислительной мощью компьютерных алгоритмов. Машины одержали победу над лучшими из людей в области шахмат, телевикторины Jeopardy! или даже го (одной из самых сложных настольных игр в мире). Принадлежащая Google команда DeepMind, по сути, взяла верх в ещё одной дисциплине — стратегии в реальном времени StarCraft II. Всего через 18 месяцев после начала тренировок и работы над созданием подходящего алгоритма DeepMind удалось представить искусственный интеллект, который убедительно превосходит лучших в мире игроков в StarCraft II.

DeepMind назвала своего цифрового чемпиона по го именем AlphaGo, так что бот, превосходно играющий в StarCraft II, получил аналогичное прозвище — AlphaStar. За плечами этого алгоритма — более 200 лет практики. Ещё на последней конференции Blizzcon в ноябре команда DeepMind сказала, что её платформа машинного обучения смогла примерно вдвое превзойти сложность «Безумно» у компьютерных соперников, доступных игрокам в StarCraft II. С тех пор она стала ещё опаснее.

AlphaStar — это свёрточная нейронная сеть. Команда начала с повторов профессиональных матчей, дав AlphaStar отправную точку для начала игры. Благодаря интенсивным тренировкам с конкурирующими моделями, DeepMind смогла научить AlphaStar играть в игру так же, как и лучшие игроки из числа людей. Со временем она сократила набор ИИ до пяти лучших «агентов», и именно в таком виде бросила его против самых опытных в мире игроков StarCraft II.

Матчи состоялись в декабре, а на недавней интернет-трансляции в основном демонстрировались записи. Вначале AlphaStar сражался с игроком, известным под псевдонимом TLO, который в основном играет за зергов в StarCraft II. Тем не менее, ему пришлось выбрать протоссов, поскольку AlphaStar пока натренирован только против этой расы. Это было больше похоже на избиение: несмотря на все усилия TLO, AlphaStar победил человека пять раз подряд. Затем другой агент AlphaStar выступил против опытного игрока-протосса под ником MaNa. В некоторых матчах человек был близок к победе, но AlphaStar всё же снова выиграл пять игр подряд. Также MaNa боролся с новым агентом AlphaStar в прямом эфире, и на этот раз ему удалось одержать победу над машиной.

AlphaStar продемонстрировал впечатляющий уровень микроуправления войсками на протяжении всех матчей. Он быстро отодвигал повреждённые отряды в тыл, выдвигая более сильных на передовую линию. AlphaStar также контролировал темп битвы, продвигая отряд вперёд и отступая в нужное время, чтобы нанести урон, получая при этом меньше повреждений. Причём речь шла не о превосходстве в количестве прямых действий в минуту (APM) — показатель APM у AlphaStar существенно ниже, чем у игроков-людей: алгоритм просто совершал более разумные действия.

ИИ также использовал некоторые любопытные стратегические приёмы. Алгоритм часто отправлял отряды на возвышенности — это опасно в StarCraft II, поскольку из-за «тумана войны» игрок не видит, что его там ждёт, пока не поднимется. Тем не менее, это как-то сработало. AlphaStar также отказался от проверенной тактики блокировки входа на базу стеной зданий. Это основная тактика в StarCraft II, но ИИ не беспокоился об этом и всё же сумел защитить свои базы.

Только в финальном матче в прямом эфире человек смог обнаружить изъян в одном из агентов. Эта версия AlphaStar решила перебросить почти всю свою армию как единое целое, чтобы смести базу MaNa. Тем не менее, последний смог несколько раз переместить нескольких своих бойцов в тыл базы AlphaStar. Каждый раз в таком случае AlphaStar поворачивал всю свою армию, чтобы справиться с угрозой. Это дало MaNa достаточно времени, чтобы усилиться и дать достойный отпор ИИ.

В итоге AlphaStar выиграл 10 матчей против профессиональных игроков и проиграл только один. Если алгоритм сможет обучиться на основе последнего матча, в следующий раз он может оказаться вовсе непобедимым.

ИИ-система DeepMind способна диагностировать более 50 глазных болезней

Последние два года DeepMind, ИИ-компания во владении Alphabet, пыталась разработать новый способ обнаружения заболеваний глаз, способных лишить человека зрения. Теперь исследователи, наконец, поделились достигнутыми результатами — их система умеет диагностировать более 50 болезней не хуже, чем профессиональные доктора.

DeepMind создала из двух нейронных сетей систему, которая может анализировать результаты оптической когерентной томографии (ОКТ). Они представляют собой трёхмерные изображения глаза, которые специалисты осматривают на наличие признаков заболеваний.

Сначала сегментационная нейронная сеть анализирует результат ОКТ и ищет различные типы болезней глаз и их симптомы. Затем ещё одна сеть, классификационная, определяет диагноз и рекомендует лечение.

Система создана таким образом, что врачи могут просматривать сгенерированные карты и узнавать вероятность выдачи тех или иных рекомендаций по лечению. Так становится понятно, почему и как программа сделала то или иное заключение.

DeepMind завершила первый этап исследовательского партнёрства со специализированной английской больницей Moorfields Eye Hospital. Если технология пройдёт клинические испытания, то будет введена в 30 здравоохранительных учреждениях, которые обслуживают около 300 тысяч пациентов в год.

В компании отметили, что её технология может быть использована и с другими сканерами глаз. Поэтому число заболеваний, которые система способна обнаружить, может сильно увеличиться.

window-new
Soft
Hard
Тренды 🔥
«Вкусвилл» сообщил об утечке персональных данных некоторых клиентов 7 ч.
Новая статья: The Callisto Protocol — действительно мёртвый космос. Рецензия 12 ч.
Подписчики Game Pass получат доступ ко всем персонажам Valorant и League of Legends уже на следующей неделе 12 ч.
Паровозик, который смог: ужастик про кошмарный поезд Choo-Choo Charles расстроил критиков, а простым геймерам понравился 13 ч.
Системные требования нового поколения: для комфортной игры в Returnal на ПК понадобится 32 Гбайт оперативной памяти 14 ч.
Мультиплеерная Party Animals про драки зверюшек получила на The Game Awards 2022 забавный трейлер, который скрывает неприятные новости 17 ч.
Axenix отмечает рост спроса на услуги по локализации ИБ-инфраструктуры 17 ч.
Против Rackspace подан коллективный иск в связи с недельной недоступностью облачного сервиса Microsoft Exchange 21 ч.
Бывший глава FTX может оказаться причастен к краху криптовалюты Terra 22 ч.
Все анонсы и трейлеры с The Game Awards 2022 22 ч.
Остатки развалившейся в ноябре китайской ракеты образовали большое облако космического мусора 29 мин.
Некоторые опции гибридного спорткара Chevrolet Corvette E-Ray засветились в конфигураторе на сайте производителя 4 ч.
Apple и Ericsson отказались от судебных претензий и продлили лицензионное соглашение 5 ч.
Предварительный заказ на PlayStation VR2 сейчас можно оформить без приглашения 5 ч.
Wing запустила новый центр по управлению доставкой дронами 15 ч.
Hyperion Research: «квантовой зимы» не будет, но рынок всё ещё молод и вырастет только до $1,2 млрд в 2025 году 16 ч.
На просторах Атлантики появятся пирамиды — это будут новые плавучие ветряные генераторы 16 ч.
Gigabyte выпустит Radeon RX 7900 XTX в исполнениях Aorus Elite и Gaming OC 16 ч.
В конце декабря Tesla приостановит производство на заводе в Китае 16 ч.
Перевод сотовых сетей на российское оборудование отложат — пока что не получается наладить производство 17 ч.