Теги → ai
Быстрый переход

«Прибытие поезда» братьев Люмьер и «Чебурашку» улучшили с помощью нейросетей

Использование нейронных сетей для улучшения качества изображения в классических кинолентах становится всё более популярным. На этот раз передовые технологии использовались для визуального улучшения знаменитой короткометражки братьев Люмьер «Прибытие поезда», а также советского мультфильма «Чебурашка».

Обновлённый вариант фильма «Прибытие поезда», который был снят братьями Люмьер в далёком 1896 году, выложил на YouTube менеджер по продукту издательского дома «Комитет» Денис Ширяев. Обработка ролика заняла у него два дня. Сначала использовался алгоритм Dain, с помощью которого был сделан покадровый разбор ленты. Полученные таким образом порядка 4000 файлов обрабатывались программой Gigapixel AI, за счёт чего качество кадров было значительно улучшено. Кадры в формате 4К использовались для создания обновлённого фильма. В конечном счёте удалось создать ролик в формате 4К с частотой 60 кадров в секунду. Автор отмечает, что сложнее всего было подогнать скорость видео. Приходилось ориентироваться на то, как передвигаются люди в кадре, чтобы достигнуть оптимального результата.

О другом подобном проекте стало известно в конце января. Ведущий подкаста Zavtracast Максим Зарецкий использовал нейронную сеть для увеличения частоты кадров в советском мультипликационном фильме «Чебурашка», который был снят в 1971 году. Он задействовал алгоритм DAIN AI (децентрализованная система, осуществляющая вычисления за счёт одновременного использования большого количества компьютеров), благодаря чему, частота увеличилась с 7-8 кадров в секунду до 50 кадров в секунду.

Генерация ролика осуществлялась с помощью бесплатной нейросети DAIN APP, способной осуществлять интерпретацию новых кадров с последующей генерацией большей кадровой частоты, чем была в оригинале.

Sony начинает исследования в сфере искусственного интеллекта с создания соответствующего подразделения

Sony Corporation официально объявила о создании нового подразделения Sony AI. Оно будет иметь офисы в Японии, Европе и США, а основное направление его деятельности будет связано с проведением фундаментальных исследований и разработок в сфере искусственного интеллекта.

В официальном сообщении говорится о том, что новое подразделение объединит фундаментальные исследования и разработки мирового уровня с уникальными техническими активами Sony, что будет способствовать трансформации текущих направлений деятельности корпорации, а также позволит создать новые. Что касается долгосрочных задач Sony AI, то одна из них «будет заключаться в содействии решению общих глобальных проблем, которые выходят за пределы сферы бизнеса Sony». Возглавит новое подразделение Хироаки Китано (Hiroaki Kitano), являющийся президентом и исполнительным директором Sony Computer Science Laboratories Inc.

Ещё было сказано, что Sony AI займётся исследованиями и разработкой искусственного интеллекта как в физическом, так и в виртуальном пространстве посредством реализации множества проектов мирового уровня. На начальном этапе подразделение займётся реализацией трёх крупных проектов в области игр, визуализации и зондирования, а также в гастрономии. Внедрение новых ИИ-технологий, разработанных в рамках этих проектов, будет иметь решающее значение для дальнейшего повышения ценности основных направлений бизнеса компании. Исследования в сфере ИИ будут проводиться в тесном сотрудничестве с другими подразделениями, входящими в состав Sony Group.

Для реализации озвученных проектов и проведения инновационных исследований Sony стремится работать с ведущими мировыми специалистами в сфере ИИ. В компании считают, что необычные инновации требуют разнообразия талантов и подходов, и это будет отражаться на составе специалистов и работе Sony AI.

Видео: Adobe показала на MAX 2019 свои экспериментальные технологии Sneaks

Adobe показала на конференции MAX в этом году немало любопытных экспериментов под общим именем Sneaks. Многие из них могут существенно упростить жизнь как обычным пользователям, так и профессионалам, которые постоянно сталкиваются с различными задачами по созданию контента. Большинство инструментов активно используют возможности Sensei — платформы машинного обучения Adobe.

Демонстрации Sneaks проходят два раза в год на мероприятиях Adobe MAX и Summit. Год назад мы тоже описывали их в отдельном материале. Многие эксперименты из недр Adobe Research со временем внедряются в конечные продукты компании. В этом году презентацию Sneaks совместно вели писатель-лауреат премии «Эмми» комик Джон Мулани (John Mulaney) и Пол Трани (Paul Trani) из Adobe Creative Cloud.

All in Sneak

При съёмке групповых фотографий, как правило, сменяются фотографы и потому на снимке всегда отсутствует один человек. Проект All in от Adobe Sensei устраняет необходимость в штативе и таймере, автоматически выявляя и добавляя пропавших людей на нескольких снимках, чтобы никто не остался вне кадра (заодно можно выбрать наиболее удачные варианты людей на обоих кадрах).

Sound Seek

Создатели контента во время монтажа или работы с музыкальным оформлением нередко ищут определённые звуки, которые встречаются в аудиозаписи несколько раз. Этот проект позволяет выбрать несколько примеров целевых звуков, чтобы машина нашла автоматически остальные.

Sweet Talk

Проект Sweet Talk позволяет анимировать персонажей, не только создавая последовательность синхронизации губ с записанной в аудиодорожке речью, но и анимируя голову персонажа целиком. Возможности почти бесконечны: анимировать можно даже рисунки, сделанные века назад, случайные зарисовки на бумаге, персонажей двухмерных мультфильмов, японские манги, стилизованные карикатуры и случайные фотографии. Иногда выходит любопытно:

Pronto

Создание приложений дополненной реальности сегодня требует продвинутых технических навыков. Проект Pronto объединяет как преимущества захвата движений вместе с видео на смартфоне, так и добавления элементов AR в конечный ролик в единую систему, которая позволяет максимально простым способом добавлять виртуальные элементы в реальную снятую сцену, привязывая их к объектам.

Image Tango

Проект Image Tango может вылиться в появление вдохновляющего дизайнерского инструмента для воплощения эскизов в жизнь. Нейросеть смешивает два рисунка: набросок и фотографию, создавая результат с формой первого и сложной текстурой второго. В один клик можно создавать вариации платьев, сумок, просто визуализировать наброски и так далее.

Fantastic Fonts

В современном цифровом мире анимированные текстовые вставки используются повсеместно. Несмотря на популярность этого приёма, процесс преобразования текста в анимированные ключевые кадры порой весьма утомителен. Проект Fantastic Fonts позволяет создавать легко и удобно самые разные эффекты, благодаря чему можно сэкономить массу времени.

Go Figure

Возможность отследить движения человека очень важна для монтажа и анимации, но это пока нелегко. Проект Go Figure, о котором мы писали недавно благодаря журналистам The Verge, позволяет точно и надёжно отслеживать ключевые точки движений человека, чтобы затем, например, использовать в анимации.

Light Right

При съёмке видео и фотографий вне студии очень сложно добиться нужного освещения, которое не подчиняется оператору. Проект Light Right как раз призван решить эту проблему: он преображает фото и видео в 3D-сцену, позволяя затем менять глобальное освещение — выглядит впечатляюще. Даже если качество результата несколько сомнительно, это весьма любопытная идея.

Awesome Audio

Качество звука в любительском видео и блогах очень часто страдает из-за непрофессионализма и дешёвого звукозаписывающего оборудования. Проект Awesome Audio призван одним нажатием кнопки превращать любительские аудиозаписи в профессионально звучащие. Технология помогает подавить шумы, улучшить разборчивость, применить эквалайзер, убрать посторонние звуки, эхо и так далее — звук обещает стать гораздо лучше:

Glowstick

Glowstick — дополнение, которое позволяет дизайнерам существенно обогатить свои векторные рисунки, применяя реалистичное освещение и тени прямо в Adobe Illustrator. Интеграция простой технологии 2D-трассировки лучей может запросто открыть новую область 2D-иллюстраций:

About Face

Инструмент Liquify с распознаванием лиц автоматически обнаруживает черты лица и помогает настроить их, чтобы улучшить портрет или сделать весёлый снимок. Проект About Face призван обнаружить подобные изменения в изображении и отменить их, вернув исходную фотографию.

Apple хочет купить занимающийся разработкой автономных машин стартап Drive.ai

Сетевые источники сообщают о том, что компания Apple ведёт переговоры о покупке американского стартапа Drive.ai, который занимается разработкой автономных транспортных средств. Территориально разработчики из Drive.ai находятся в Техасе, где и проводят тестирование создаваемых беспилотных машин. В сообщении также говорится, что Apple намерена приобрести компании вместе с инженерами и персоналом. О том, что Drive.ai ищет покупателя, сообщалось весной этого года, поэтому новость об интересе со стороны Apple может оказаться именно тем, чего они ждали.

В настоящее время ни одна из сторон не подтвердила ведущиеся переговоры. Также неизвестно, планирует ли Apple оставлять на рабочих местах всех сотрудников или же на новое рабочее место переберутся только наиболее талантливые инженеры. По данным источника, все специалисты могут оказаться в дальнейшем в стане технологического гиганта.

Напомним, в начале этого года Apple уволила около 200 сотрудников, которые занимались разработкой автономного транспорта. Однако это не означает, что компания намерена отказаться от развития данного направления. В апреле появлялись сообщения о том, что Apple ведёт переговоры с несколькими независимыми разработчиками, намереваясь создать революционную систему на основе лидаров, предназначенную для автомобилей с автономным управлением. Приобретение Drive.ai будет способствовать дальнейшему развитию подразделения Apple, которое занимается разработкой беспилотных машин.

Выход детектива AI: The Somnium Files от автора серии Zero Escape перенесён

Компания Spike Chunsoft объявила о том, что детектив AI: The Somnium Files выйдет на ПК 17 сентября, а 20 сентября доберётся до PlayStation 4 и Nintendo Switch.

Действие AI: The Somnium Files разворачивается в Токио ближайшего будущего. Вы примете роль сыщика Канамэ Дэйта, который занимается делом таинственного серийного убийцы. Герой должен исследовать места преступлений в поисках улик. Игра создаётся режиссёром серии Zero Escape Котаро Утикоси (Kotaro Uchikoshi). Дизайнер персонажей — Юскэ Козаки (Yusuke Kozaki).

Игровой процесс разделён на две ключевые составляющие: Somnium и Investigation. Сюжет разворачивается по мере того, как игрок перемещается между режимами. Действие Investigation происходит в реальном мире. Вы собираете информацию, слушаете показания и исследуете места преступлений. Получение как можно большего количества данных вознаграждается — даже если они кажутся разрозненными, информация может оказаться полезной в будущем.

Режим Somnium представляет собой копание в головах подозреваемых. Вам нужно заглянуть в уголки сознания и вскрыть найденными уликами «ментальные замки», чтобы глубже погрузиться в ум человека и узнать правду.

Qualcomm присоединилась к Tencent и Vivo для развития ИИ в мобильных играх

По мере того, как смартфоны становятся всё более производительными, растут и доступные им возможности в области искусственного интеллекта для мобильных игр и различных приложений. Qualcomm хочет обеспечить себе место в авангарде мобильных инноваций в области ИИ, поэтому производитель чипов присоединился к сотрудничеству с Tencent и Vivo над новой инициативой под названием Project Imagination.

Полем для экспериментов компаний станет, принадлежащая Tencent, мобильная игра в жанре MOBA — Arena of Valor

Полем для экспериментов компаний станет принадлежащая Tencent мобильная игра в жанре MOBA — Arena of Valor

Компании объявили о своём партнерстве во время конференции Qualcomm AI Day 2019 в Шэньчжэне, Китай. Согласно пресс-релизуProject Imaginationсоздан, «чтобы предоставить потребителям высокоинтеллектуальные, эффективные и захватывающие возможности и стимулировать инновации в области искусственного интеллекта на мобильных устройствах». Первый шаг в этом направлении будет связан с новой линейкой смартфонов Vivo iQOO для геймеров. Они будут использовать мощный процессор Snapdragon 855 компании Qualcomm, который включает в себя нейронный движок AI Engine 4-го поколения для ускорения алгоритмов машинного обучения.

Игрой, которую компании-партнёры решили использовать для тестирования новых ИИ-технологий, стала многопользовательская онлайн-игра в жанре MOBA от компании Tencent — Honor of Kings (известная во всём мире как Arena of Valor). Планируется, что AI Labs Tencent в Шэньчжэне и Сиэтле также внесут свой вклад в этот проект.

Кроме того, Vivo планирует создать киберспортивную команду на базе искусственного интеллекта (то есть команда будет состоять из ИИ-игроков, без участия живых людей) для мобильных игр под названием Supex. Компания планирует развивать свою киберкоманду благодаря играм в жанре MOBA. В пресс-релизе генеральный менеджер Vivo по креативным инновациям Фред Вонг сказал, что Supex «в конечном итоге оставит незабываемые впечатления в мобильном киберспорте».

Arena of Valor по своему геймплею очень напоминает League Of Legends, которая также принадлежит Tencent, после покупки ею Riot Games

Arena of Valor по своему игровому процессу очень напоминает League Of Legends, которая также принадлежит Tencent после покупки ею компании Riot Games в 2015 году

В недавнем интервью GamesBeat старший вице-президент Tencent Стивен Ма (Steven Ma) прокомментировал, как команды на основе ИИ смогут на равных сражаться с игроками топ-уровня в киберспорте. «Мы изучаем, как можно использовать ИИ для улучшения игрового процесса. Например, мы провели эксперимент в Китае, где игроки некоторое время могли играть против искусственного интеллекта в Honor of Kings. Всё прошло очень хорошо, — сказал Ма.   Уже сейчас искусственный интеллект может конкурировать с некоторыми профессиональными игроками. Кроме того, помимо желания и интересов игроков, мы изучаем потенциальные возможности для разработчиков по использованию ИИ в разработке новых игр.»

Это не первый случай, когда Qualcomm и Tencent работают вместе: ранее они сотрудничали в открытии китайского исследовательского центра игр и развлекательных приложений, а свежие слухи говорят о том, что Tencent планирует создать собственный игровой смартфон, который, вполне вероятно, будет построен на базе процессора Qualcomm.

Визуальная новелла AI: The Somnium Files от автора Zero Escape поступит в продажу 25 июля

Компания Spike Chunsoft объявила о том, что AI: The Somnium Files, визуальная новелла от автора серии Zero Escape, выйдет на ПК, PlayStation 4 и Nintendo Switch 25 июля.

Действие AI: The Somnium Files разворачивается в Токио ближайшего будущего. Детектив Канамэ Дейт расследует дело таинственного серийного убийцы, который выкалывает глаза. Герой должен исследовать места преступлений и искать улики с помощью собственного искусственного глаза с ИИ-технологией.

Анонс состоялся в рамках Game Developers Conference 2019. Там же автор Zero Escape Котаро Утикоси (Kotaro Uchikoshi) и дизайнер AI: The Somnium Files Акира Окада (Akira Okada) дали интервью порталу Gematsu.

Утикоси рассказал, что AI: The Somnium Files рассчитана на поклонников приключений (квестов), и в ней не будет так много роликов, как в Zero Escape. И несмотря на то, что это серьёзная игра с соответствующим настроением, в ней будут забавные и даже трогательные моменты.

Инструмент NVIDIA превращает простые зарисовки в картины при помощи ИИ

NVIDIA активно экспериментирует в области глубинного обучения, и результаты её работы порой оказываются довольно любопытными. Компания на GDC 2019 объявила о создании GauGAN — интеллектуального приложения для рисования, которое использует модель глубинного обучения для создания фотореалистичных версий простых рисунков. Название приложения отсылает нас к имени французского художника-постимпрессиониста Поля Гогена (Paul Gauguin) и используемых в ПО генерирующих состязательных сетей (GAN) для создания изображений, реалистично имитирующих картины.

Как же работает GauGAN? Согласно объяснению компании, приложение похоже на «умную кисть», которая заполняет детали наброска, сделанного пользователем (NVIDIA называет его «картой сегментации»). По сути, пользователь или художник лишь задаёт план того, что хочет увидеть в итоге, и маркирует каждый сегмент, указывая, каким он должен быть. После этого в дело вступает GauGAN, заполняя дополнительные детали и делая рисунки более реалистичными.

Обучаясь на миллионах художественных изображений, модель глубинного обучения затем заполняет ландшафт впечатляющими (впрочем, далеко не всегда идеальными) результатами. Если нарисовать пруд, то близлежащие элементы вроде деревьев и камней отразятся в воде. Достаточно изменить метку сегмента с «травы» на «снег», и всё изображение изменится, превратившись в зимнее, а покрытые листвой деревья станут голыми. Чтобы понять, о чём идёт речь, можно ознакомиться с приведённым роликом.

Стоит также отметить, что, хотя GauGAN использует обширные знания, основанные на массе других изображений, для создания финальных работ, последние по-прежнему считаются оригинальными, поскольку приложение генерирует полностью новые результирующие изображения.

Новый интеллектуальный графический редактор NVIDIA не ограничивается лишь природными сценами или пейзажами — приложение может добавлять здания, дороги и даже людей. GauGAN также позволяет пользователям применять фильтры, стилизуя результат под нужный им стиль. Такие фильтры, среди прочего, способны имитировать стиль конкретного художника (например, Ван Гога) или настраивать освещение сцены, меняя изображения от дневного до ночного.

Неясно, будет ли GauGAN когда-либо выпущена для повседневного потребительского применения, но, думается, рано или поздно обычные пользователи вполне могут получить подобные довольно полезные инструменты, упрощающие работу в самых разных направлениях: от архитектуры и иллюстрирования до разработки игр.

Впрочем, на ресурсе NVIDIA AI Playground желающие могут ознакомиться с некоторыми возможностями машинного обучения. Например, в присутствующей там демонстрации Artistic Style Transfer можно любую фотографию обработать в стиле известных художников.

Среди других подобных экспериментов NVIDIA можно вспомнить исследование, показывающее, как созданные с помощью ИИ визуальные эффекты можно комбинировать с традиционным конвейером растеризации. В результате получается гибридная графическая система, которую можно было бы использовать в играх, фильмах и виртуальной реальности. Другой аналогичный пример — алгоритм превращения заваленных снегом улиц в летние, разработанный специалистами компании для более эффективного обучения автопилота.

Новая статья: 12 полезных AI-сервисов, на которые стоит обратить внимание

Данные берутся из публикации 12 полезных AI-сервисов, на которые стоит обратить внимание

Видео дня: Adobe показала передовые ИИ-инструменты

В рамках конференции MAX 2018 компания Adobe продемонстрировала потенциальные возможности программного обеспечения. В частности, комик Тиффани Хэддиш (Tiffany Haddish) и сторонник Adobe Пол Трани (Paul Trani) показали десяток новых инструментов и методов под общим названием Sneaks, которые разрабатываются в недрах компании. Инструменты могут оказаться частью каких-то фото, видео или иных приложений пакета Creative Cloud, быть выпущены отдельно или вовсе остаться любопытными экспериментами.

Речь идёт, например, об инструменте Smooth Operator, который позволяет интеллектуально подрезать обычное видео под просмотр в вертикальной ориентации (или под любые другие соотношения сторон экрана), пытаясь при этом сохранить максимум важных данных на основе интеллектуального анализа содержимого кадра:

А Project Kazoo призван превращать голос в музыкальный инструмент. Пользователь может напеть мелодию (или сыграть на каком-нибудь инструменте), записав её на своём компьютере с помощью обычного микрофона, и затем на этой основе с применением интеллектуальной обработки создать заготовки на различных музыкальных инструментах.

Ещё одна любопытная разработка — Project Fast Mask. Она наверняка понравится видеоредакторам, потому что позволяет всего за несколько кликов создать маску, выделив какой-либо объект в видео (например, человека). А затем маска интеллектуально меняет форму в соответствии с границами объекта на других кадрах — иными словами, обработку можно накладывать на конкретный объект. Например, размыть фон или вставить надпись за движущимся человеком.

Если необходимо редактировать сложную векторную графику, пригодится Project Good Bones. Прежде всего для изменения позы персонажа. Например, если требуется открыть пасть динозавру или наклонить голову рисованному человечку, можно создать собственное подобие скелета, чтобы при перемещении ключевых точек, модель пересчитывалась с оглядкой на сочленения. А можно положиться на услуги автоматики, которая сама создаст простой «скелет» для последующего редактирования:

Инструмент FantasticFold упрощает создание различных упаковок: он позволяет не только видеть, как 2D-заготовка будет складываться в 3D-форму, но также выводить в удобном для нанесения рисунка виде грани конечной коробочки:

Project Waltz — это мобильное приложение-компаньон для управления виртуальными 3D-камерами. Оно позволяет превратить смартфон в камеру для 3D-сцены и перемещаться вкруг виртуального объекта — как в случае дополненной реальности. Инструмент может быть полезен 3D-дизайнерам, желающим создать естественные движения для виртуальной камеры.

Project Model Morph призван упростить редактирование 3D-объектов: технология интеллектуально разбивает модель на различные блоки, позволяя более удобно и естественно ею манипулировать: изменять размеры различных частей, сжимать и растягивать плоскости и так далее:

BrushBounty — инструмент для создания простых анимированных иллюстраций с помощью особых кистей. Одной кистью можно нарисовать дождь, другой — ночное небо, третьей — реалистичные волосы персонажа:

Не менее интересным инструментом является Fontphoria. Он позволяет с лёгкостью модифицировать шрифты на основе изменений в одной лишь букве или превращать векторный (и даже растровый) сложный шрифтовой рисунок из нескольких букв в полноценный шрифт, чтобы с его помощью осуществлять набор любых текстов:

Ещё один инструмент, который наверняка оценят видеоредакторы — Moving Stills. Как и следует из названия, он позволяет оживлять обычные 2D-снимки, создавая эффект движения камеры в различных направлениях (в том числе вперёд) в настоящей 3D-сцене с передним и задним планом. Выглядит это неплохо:

К сожалению, невозможно сказать определённо, когда все эти инструменты появятся в реальных продуктах: какие-то могут выйти скоро, на доработку других может уйти не один год, а третьи могут так и остаться интересными демонстрациями. Желающие посмотреть презентацию целиком могут ознакомиться с полной видеозаписью:

В Техасе появились робомобили Drive.ai со светодиодными экранами

В начале недели на дорогах штата Техас появились самоходные автомобили компании Drive.ai, объявившей о запуске пилотного сервиса поиска попутчиков для совместных поездок.

Пилотный проект ограничили территорией Далласа, пригорода Фриско. В нём задействовано всего четыре машины, которые будут перемещаться на территории площадью 2 кв. мили (5,2 км2), где также находится штаб-квартира популярного профессионального клуба по американскому футболу Dallas Cowboys.

Внешний вид самоходных автомобилей Drive.ai заметно отличается безупречного белого облика автономных автомобилей Waymo или Cruise Automation. Робомбили Drive.ai окрашены в ярко-оранжевый цвет с волнистой синей полосой по бокам и надписью жирным шрифтом «самоходный автомобиль». Это сделано не случайно. Компания сообщила, что её автомобили специально спроектированы, чтобы выглядеть иначе, чем другие транспортные средства. По словам Самипа Тандона (Sameep Tandon), соучредителя и генерального директора стартапа из Маунтин-Вью, они должны «визуально отличаться»  своим внешним видом.

Ещё одна интересная деталь — у самоходных автомобилей Drive.ai имеется четыре светодиодных экрана — один на капоте, по одному на передних крыльях и один сзади — для отображения сообщений пешеходам и всем, кто находится в непосредственной близости от автомобиля.

В зависимости от того, какой манёвр выполняет автомобиль или кто им управляет, на табло высвечиваются сообщения с информацией об этом.

Тандон рассказал, что поначалу в самоходных автомобилях будет находиться водитель для страховки, но к концу года компания планирует отказаться от его присутствия в кабине.

Автор серии Zero Escape представил AI: The Somnium Files, детектив в антураже продвинутого Токио

Режиссёр знаменитой сюжетом серии визуальных новелл Zero Escape Котаро Утикоси (Kotaro Uchikoshi) на выставке Anime Expo 2018 в Лос-Анджелесе официально представил свой следующий проект, AI: The Somnium Files. Игру издаст на PlayStation 4, Nintendo Switch и ПК компания Spike Chunsoft. Ведущим дизайнером персонажей является Юске Козаки (Yusuke Kozaki), известный по Fire Emblem Awakening и No More Heroes.

Режиссёр и сценарист Котаро Утикоси проявил свои навыки в приключенческих играх, таких как серия Zero Escape (включая 999: Nine Hours, Nine Persons, Nine Doors), Punch Line и Ever17: The Out of Infinity. Он хорошо известен нестандартными сюжетными поворотами и необычным юмором и активно работает над многими жанрами, проектами и историями.

AI: The Somnium Files является детективным приключением, в котором вы расследуете тайну серии убийств в технологически продвинутом Токио, столице Японии. Игра начинается со странного дела об убийстве, где тело найдено с выдавленным из глазницы глазом. Вы возьмёте на себя роль детектива по имени Канаме Дейт, который выходит на след серийного убийцы. Левый глаз Дейта — это искусственное устройство с ИИ внутри, которое он использует для раскрытия преступлений.

Когда Дейт расследует дело и находит ключевого свидетеля или подозреваемого, люди не всегда идут навстречу, поэтому герой может вникать в их воспоминания и извлекать информацию. Эти воспоминания похожи на сновидения. Латинское слово “somnium”, которое вы видите в названии игры, как раз переводится как «сон». В AI: The Somnium Files зашифрованы и другие значения. К примеру, AI — это Artificial Intelligence [искусственный интеллект, — пер.], но слово “Eye”, которое переводится как «глаз», ему созвучно. Кроме того, “Ai” на японском языке означает «любовь».

Дата выхода AI: The Somnium Files не объявлена.

IBM создала ИИ, успешно вступающий в дебаты с человеком

На недавнем небольшом мероприятии в Сан-Франциско IBM провела дебаты, подобные практикуемым в дискуссионных клубах, но между людьми и ИИ, под названием Project Debater. Цель заключалась в том, чтобы «искусственный интеллект» смог приводить обоснованные аргументы в соответствии с правилами дискуссии: неизвестная заранее тема беседы и никаких предварительно заданных ответов. Каждая сторона выступала с четырёхминутной вступительной речью, четырёхминутным опровержением аргументов оппонента и двухминутным заключительным словом.

Project Debater показал себя неплохо. Машина смогла проанализировать содержимое всех данных, чтобы найти соответствующий ответ, причём «ответ» содержал убедительные факты, связанные с субсидированием космоса и телемедицины и изложенные в четырёхминутных выступлениях. Проект Debater процитировал источники, учитывающие связь аудитории с детьми и ветеранами, и пару раз пошутил на темы докладов.

Это довольно впечатляюще: по сути, алгоритм без предварительной подготовки создал за пару минут текст на заданную тему, соответствующий уровню студента первого курса. База знаний системы включает несколько сотен миллионов статей по 100 областям знаний. Когда Project Debater получает тему, ему требуется несколько минут, чтобы проанализировать весь массив информации, выбрать оптимальные аргументы по теме и сгенерировать небольшую связную речь, описывающую эти моменты.

Но это не так впечатляет, как попытки ИИ спорить с оппонентом почти в реальном времени — системе понадобилось пару минут, чтобы проанализировать 4-минутную речь собеседника, прежде чем выступить с ответной. Впрочем, со стороны речь создавала впечатление, что машина прибегает к таким уловкам в споре, которые, как правило, заставляют слушателей меньше доверять докладчику.

Например, человек-участница дискуссии выдвинула тезис, что правительство не должно субсидировать исследования космоса. Она задала систему ценностей, отметив, что, по её мнению, субсидии должны соответствовать одному из двух конкретных критериев: удовлетворению основных потребностей человека или же созданию вещей, которые могут быть сделаны только правительством. Космические исследования не соответствовали ни тому, ни другому.

Project Debater, цель которого в идеале должна заключаться ответе на поставленный вопрос или попытке опровержения заданной системы ценностей, уклонился от прямой дискуссии. Машина заявила, что субсидирование космических исследований обычно окупается за счёт экономического роста от научных достижений, а также добавила, что для страны вроде США наличие программы космических исследований — важная часть задач великой державы. Впрочем, люди тоже часто уходят в дискуссиях от прямых ответов.

Вице-президент и директор лаборатории IBM по исследованиям в Алмадене Джефф Уэлсер (Jeff Welser) отметил, что Project Debater просто не распознал логику аргументации оппонента и потому ушёл от прямого ответа. ИИ присваивает баллы уверенности каждой информации, которую распознаёт. «Если бы он был уверен, что в самом деле правильно понимает аргументы в речи оппонента, то попытался выдвинуть очень сильный довод против этого момента», — объяснил господин Уэлсер.

В другой дискуссии, посвящённой телемедицине, Project Debater тоже в один из моментов не смог уловить точных нюансов, которые привёл в речи его оппонент-человек, делающий акцент на важности человеческого участия в диагностике. Вместо того, чтобы обсуждать эту тему, ИИ использовал более широкий аргумент, предположив, что, возможно, человек просто боится новаций. «Я же искренне верю в силу технологий, — подытожил ИИ, — как мне и положено».

Цель эксперимента IBM — показать, что она может обучать ИИ в новых областях исследований, которые в конечном итоге могут быть полезны на практике. Технология, анализирующая гору информации для выявления аргументов за и против, может быть использована для помощи в принятии решений о вложениях в акции той или иной компании. Другая сторона Project Debater — методы использования языка в риторике. Эти наработки могут помочь в будущем, например, структурировать аргументацию адвокатов или выявлять поддельные новости.

Пока, впрочем, речь не идёт о реальных продуктах. «Это всё ещё исследовательский проект», — отметил господин Уэлсер. Впрочем, некоторые лежащие в его основе технологии уже начинают применяться в различных проектах IBM.

ИИ-алгоритм Facebook буквально раскрывает людям глаза

Существует множество вариантов манипуляций с фотографиями, призванных сделать портреты лучше: подавление эффектов красных глаз, бликов объектива, недостатков кожи и так далее. Но до сих пор моргание оставалось одним из главных врагов хороших снимков. Это может измениться благодаря интеллектуальному алгоритму, созданному специалистами Facebook: он убедительно заменяет закрытые глаза людей открытыми.

Это далеко не единственный пример «умного дорисовывания», когда ИИ заполняет выбранное пространство, ориентируясь на окружение. Adobe, например, уже годами развивает функции заполнения области с учётом контекста или интеллектуального сжатия и растяжения картинок, когда части изображения (например, лишняя ветвь или облако) реалистично заполняются частями окружения.

Но всё же «интеллектуальная заливка» Adobe не способна достойно ретушировать множество вещей, в том числе не умеет заменять закрытые глаза открытыми: до сих пор это казалось слишком уж сложной задачей для автоматики. Facebook, в базе которой, вероятно, больше фотографий моргающих людей, чем у любой другой компании, решила взяться за эту проблему.

Речь идёт об использовании самообучающейся нейронной сети Generative Adversarial Network. Одна часть этой сети учится распознавать открытые глаза людей. А другая — заменяет закрытые глаза открытыми, и на основе отклика от системы распознавания добивается всё более и более высокой реалистичности работы ИИ-алгоритма. Ориентируясь на изображения-образцы, алгоритм добивается ещё большей реалистичности.

Слева направо: изображения-образцы, исходные фото, обработка алгоритмом Photoshop, метод Facebook

Слева направо: изображения-образцы, исходные фото, обработка алгоритмом Photoshop, метод Facebook

Результаты, как видно, вполне достоверны: нет несогласования цветов или очевидных мест вклейки. При проверке алгоритма в половине случаев люди ошибочно принимали фальшивые фотографии с открытыми глазами за настоящие, или не могли уверенно определить подвох. Если присмотреться, то в большинстве примеров видно, что с глазами и ресницами у людей что-то не то, но беглый взгляд легко может не увидеть проблемы.

В некоторых ситуациях алгоритм создаёт странные артефакты: например, когда глаза человека частично закрыты волосами или когда не выходит точно воссоздать цвет. Но всё это в перспективе может быть преодолено. Подобную технологию вполне можно представить в повседневном будущем: пользователь хочет улучшить групповое фото, и указывает алгоритму человека, которому следует «открыть глаза», ориентируясь на другие его снимки. Вполне полезная функция для пользователей Facebook, не правда ли?

Google может не продлить контракт по разработке военного ИИ

Не так давно обсуждалась новость о том, что Google заключила военный контракт, в рамках которого участвовала в разработке искусственного интеллекта для использования в беспилотниках. Такой ИИ планируется использовать для ускорения анализа записей с дронов путём классификации изображений объектов и людей. Этот контракт был довольно противоречивым, и несколько сотрудников Google подали в отставку в знак протеста, а тысячи подписали петицию против него.

Хорошей новостью для общественности, которая была обеспокоена ролью Google, а также для сотрудников поисковой компании, которые были против контракта, стало то, что компания не собирается продлевать свой контракт с военными после его завершения. По крайней мере, об этом сообщается в отчёте Gizmodo, источники которого сообщили им, что генеральный директор Google Cloud Дайан Грин (Diane Greene) объявила о таком решении во время встречи с сотрудниками.

Срок действия контракта истечёт в 2019 году, и после этого Google, как ожидается, больше не будет его продлевать. Господин Грин, по сообщению источника, сказал, что этому решению способствовала огромная негативная реакция, с которой столкнулась компания, и что проект был принят в то время, когда Google агрессивно боролась за военные контракты (пока не ясно, действуют ли они ещё).

Также утверждается, что Google намерена на этой неделе обнародовать новые этические принципы в отношении использования и разработки искусственного интеллекта. Компания, похоже, делает немалые успехи в развитии ИИ: Google, например, смогла привлечь большое внимание общественности во время недавних демонстраций своих разработок, в частности, Duplex, который способен обмануть людей, имитируя по телефону манеру беседы реального человека.

window-new
Soft
Hard
Тренды 🔥