Теги → ai
Быстрый переход

Видео дня: Adobe показала передовые ИИ-инструменты

В рамках конференции MAX 2018 компания Adobe продемонстрировала потенциальные возможности программного обеспечения. В частности, комик Тиффани Хэддиш (Tiffany Haddish) и сторонник Adobe Пол Трани (Paul Trani) показали десяток новых инструментов и методов под общим названием Sneaks, которые разрабатываются в недрах компании. Инструменты могут оказаться частью каких-то фото, видео или иных приложений пакета Creative Cloud, быть выпущены отдельно или вовсе остаться любопытными экспериментами.

Речь идёт, например, об инструменте Smooth Operator, который позволяет интеллектуально подрезать обычное видео под просмотр в вертикальной ориентации (или под любые другие соотношения сторон экрана), пытаясь при этом сохранить максимум важных данных на основе интеллектуального анализа содержимого кадра:

А Project Kazoo призван превращать голос в музыкальный инструмент. Пользователь может напеть мелодию (или сыграть на каком-нибудь инструменте), записав её на своём компьютере с помощью обычного микрофона, и затем на этой основе с применением интеллектуальной обработки создать заготовки на различных музыкальных инструментах.

Ещё одна любопытная разработка — Project Fast Mask. Она наверняка понравится видеоредакторам, потому что позволяет всего за несколько кликов создать маску, выделив какой-либо объект в видео (например, человека). А затем маска интеллектуально меняет форму в соответствии с границами объекта на других кадрах — иными словами, обработку можно накладывать на конкретный объект. Например, размыть фон или вставить надпись за движущимся человеком.

Если необходимо редактировать сложную векторную графику, пригодится Project Good Bones. Прежде всего для изменения позы персонажа. Например, если требуется открыть пасть динозавру или наклонить голову рисованному человечку, можно создать собственное подобие скелета, чтобы при перемещении ключевых точек, модель пересчитывалась с оглядкой на сочленения. А можно положиться на услуги автоматики, которая сама создаст простой «скелет» для последующего редактирования:

Инструмент FantasticFold упрощает создание различных упаковок: он позволяет не только видеть, как 2D-заготовка будет складываться в 3D-форму, но также выводить в удобном для нанесения рисунка виде грани конечной коробочки:

Project Waltz — это мобильное приложение-компаньон для управления виртуальными 3D-камерами. Оно позволяет превратить смартфон в камеру для 3D-сцены и перемещаться вкруг виртуального объекта — как в случае дополненной реальности. Инструмент может быть полезен 3D-дизайнерам, желающим создать естественные движения для виртуальной камеры.

Project Model Morph призван упростить редактирование 3D-объектов: технология интеллектуально разбивает модель на различные блоки, позволяя более удобно и естественно ею манипулировать: изменять размеры различных частей, сжимать и растягивать плоскости и так далее:

BrushBounty — инструмент для создания простых анимированных иллюстраций с помощью особых кистей. Одной кистью можно нарисовать дождь, другой — ночное небо, третьей — реалистичные волосы персонажа:

Не менее интересным инструментом является Fontphoria. Он позволяет с лёгкостью модифицировать шрифты на основе изменений в одной лишь букве или превращать векторный (и даже растровый) сложный шрифтовой рисунок из нескольких букв в полноценный шрифт, чтобы с его помощью осуществлять набор любых текстов:

Ещё один инструмент, который наверняка оценят видеоредакторы — Moving Stills. Как и следует из названия, он позволяет оживлять обычные 2D-снимки, создавая эффект движения камеры в различных направлениях (в том числе вперёд) в настоящей 3D-сцене с передним и задним планом. Выглядит это неплохо:

К сожалению, невозможно сказать определённо, когда все эти инструменты появятся в реальных продуктах: какие-то могут выйти скоро, на доработку других может уйти не один год, а третьи могут так и остаться интересными демонстрациями. Желающие посмотреть презентацию целиком могут ознакомиться с полной видеозаписью:

В Техасе появились робомобили Drive.ai со светодиодными экранами

В начале недели на дорогах штата Техас появились самоходные автомобили компании Drive.ai, объявившей о запуске пилотного сервиса поиска попутчиков для совместных поездок.

Пилотный проект ограничили территорией Далласа, пригорода Фриско. В нём задействовано всего четыре машины, которые будут перемещаться на территории площадью 2 кв. мили (5,2 км2), где также находится штаб-квартира популярного профессионального клуба по американскому футболу Dallas Cowboys.

Внешний вид самоходных автомобилей Drive.ai заметно отличается безупречного белого облика автономных автомобилей Waymo или Cruise Automation. Робомбили Drive.ai окрашены в ярко-оранжевый цвет с волнистой синей полосой по бокам и надписью жирным шрифтом «самоходный автомобиль». Это сделано не случайно. Компания сообщила, что её автомобили специально спроектированы, чтобы выглядеть иначе, чем другие транспортные средства. По словам Самипа Тандона (Sameep Tandon), соучредителя и генерального директора стартапа из Маунтин-Вью, они должны «визуально отличаться»  своим внешним видом.

Ещё одна интересная деталь — у самоходных автомобилей Drive.ai имеется четыре светодиодных экрана — один на капоте, по одному на передних крыльях и один сзади — для отображения сообщений пешеходам и всем, кто находится в непосредственной близости от автомобиля.

В зависимости от того, какой манёвр выполняет автомобиль или кто им управляет, на табло высвечиваются сообщения с информацией об этом.

Тандон рассказал, что поначалу в самоходных автомобилях будет находиться водитель для страховки, но к концу года компания планирует отказаться от его присутствия в кабине.

Автор серии Zero Escape представил AI: The Somnium Files, детектив в антураже продвинутого Токио

Режиссёр знаменитой сюжетом серии визуальных новелл Zero Escape Котаро Утикоси (Kotaro Uchikoshi) на выставке Anime Expo 2018 в Лос-Анджелесе официально представил свой следующий проект, AI: The Somnium Files. Игру издаст на PlayStation 4, Nintendo Switch и ПК компания Spike Chunsoft. Ведущим дизайнером персонажей является Юске Козаки (Yusuke Kozaki), известный по Fire Emblem Awakening и No More Heroes.

Режиссёр и сценарист Котаро Утикоси проявил свои навыки в приключенческих играх, таких как серия Zero Escape (включая 999: Nine Hours, Nine Persons, Nine Doors), Punch Line и Ever17: The Out of Infinity. Он хорошо известен нестандартными сюжетными поворотами и необычным юмором и активно работает над многими жанрами, проектами и историями.

AI: The Somnium Files является детективным приключением, в котором вы расследуете тайну серии убийств в технологически продвинутом Токио, столице Японии. Игра начинается со странного дела об убийстве, где тело найдено с выдавленным из глазницы глазом. Вы возьмёте на себя роль детектива по имени Канаме Дейт, который выходит на след серийного убийцы. Левый глаз Дейта — это искусственное устройство с ИИ внутри, которое он использует для раскрытия преступлений.

Когда Дейт расследует дело и находит ключевого свидетеля или подозреваемого, люди не всегда идут навстречу, поэтому герой может вникать в их воспоминания и извлекать информацию. Эти воспоминания похожи на сновидения. Латинское слово “somnium”, которое вы видите в названии игры, как раз переводится как «сон». В AI: The Somnium Files зашифрованы и другие значения. К примеру, AI — это Artificial Intelligence [искусственный интеллект, — пер.], но слово “Eye”, которое переводится как «глаз», ему созвучно. Кроме того, “Ai” на японском языке означает «любовь».

Дата выхода AI: The Somnium Files не объявлена.

IBM создала ИИ, успешно вступающий в дебаты с человеком

На недавнем небольшом мероприятии в Сан-Франциско IBM провела дебаты, подобные практикуемым в дискуссионных клубах, но между людьми и ИИ, под названием Project Debater. Цель заключалась в том, чтобы «искусственный интеллект» смог приводить обоснованные аргументы в соответствии с правилами дискуссии: неизвестная заранее тема беседы и никаких предварительно заданных ответов. Каждая сторона выступала с четырёхминутной вступительной речью, четырёхминутным опровержением аргументов оппонента и двухминутным заключительным словом.

Project Debater показал себя неплохо. Машина смогла проанализировать содержимое всех данных, чтобы найти соответствующий ответ, причём «ответ» содержал убедительные факты, связанные с субсидированием космоса и телемедицины и изложенные в четырёхминутных выступлениях. Проект Debater процитировал источники, учитывающие связь аудитории с детьми и ветеранами, и пару раз пошутил на темы докладов.

Это довольно впечатляюще: по сути, алгоритм без предварительной подготовки создал за пару минут текст на заданную тему, соответствующий уровню студента первого курса. База знаний системы включает несколько сотен миллионов статей по 100 областям знаний. Когда Project Debater получает тему, ему требуется несколько минут, чтобы проанализировать весь массив информации, выбрать оптимальные аргументы по теме и сгенерировать небольшую связную речь, описывающую эти моменты.

Но это не так впечатляет, как попытки ИИ спорить с оппонентом почти в реальном времени — системе понадобилось пару минут, чтобы проанализировать 4-минутную речь собеседника, прежде чем выступить с ответной. Впрочем, со стороны речь создавала впечатление, что машина прибегает к таким уловкам в споре, которые, как правило, заставляют слушателей меньше доверять докладчику.

Например, человек-участница дискуссии выдвинула тезис, что правительство не должно субсидировать исследования космоса. Она задала систему ценностей, отметив, что, по её мнению, субсидии должны соответствовать одному из двух конкретных критериев: удовлетворению основных потребностей человека или же созданию вещей, которые могут быть сделаны только правительством. Космические исследования не соответствовали ни тому, ни другому.

Project Debater, цель которого в идеале должна заключаться ответе на поставленный вопрос или попытке опровержения заданной системы ценностей, уклонился от прямой дискуссии. Машина заявила, что субсидирование космических исследований обычно окупается за счёт экономического роста от научных достижений, а также добавила, что для страны вроде США наличие программы космических исследований — важная часть задач великой державы. Впрочем, люди тоже часто уходят в дискуссиях от прямых ответов.

Вице-президент и директор лаборатории IBM по исследованиям в Алмадене Джефф Уэлсер (Jeff Welser) отметил, что Project Debater просто не распознал логику аргументации оппонента и потому ушёл от прямого ответа. ИИ присваивает баллы уверенности каждой информации, которую распознаёт. «Если бы он был уверен, что в самом деле правильно понимает аргументы в речи оппонента, то попытался выдвинуть очень сильный довод против этого момента», — объяснил господин Уэлсер.

В другой дискуссии, посвящённой телемедицине, Project Debater тоже в один из моментов не смог уловить точных нюансов, которые привёл в речи его оппонент-человек, делающий акцент на важности человеческого участия в диагностике. Вместо того, чтобы обсуждать эту тему, ИИ использовал более широкий аргумент, предположив, что, возможно, человек просто боится новаций. «Я же искренне верю в силу технологий, — подытожил ИИ, — как мне и положено».

Цель эксперимента IBM — показать, что она может обучать ИИ в новых областях исследований, которые в конечном итоге могут быть полезны на практике. Технология, анализирующая гору информации для выявления аргументов за и против, может быть использована для помощи в принятии решений о вложениях в акции той или иной компании. Другая сторона Project Debater — методы использования языка в риторике. Эти наработки могут помочь в будущем, например, структурировать аргументацию адвокатов или выявлять поддельные новости.

Пока, впрочем, речь не идёт о реальных продуктах. «Это всё ещё исследовательский проект», — отметил господин Уэлсер. Впрочем, некоторые лежащие в его основе технологии уже начинают применяться в различных проектах IBM.

ИИ-алгоритм Facebook буквально раскрывает людям глаза

Существует множество вариантов манипуляций с фотографиями, призванных сделать портреты лучше: подавление эффектов красных глаз, бликов объектива, недостатков кожи и так далее. Но до сих пор моргание оставалось одним из главных врагов хороших снимков. Это может измениться благодаря интеллектуальному алгоритму, созданному специалистами Facebook: он убедительно заменяет закрытые глаза людей открытыми.

Это далеко не единственный пример «умного дорисовывания», когда ИИ заполняет выбранное пространство, ориентируясь на окружение. Adobe, например, уже годами развивает функции заполнения области с учётом контекста или интеллектуального сжатия и растяжения картинок, когда части изображения (например, лишняя ветвь или облако) реалистично заполняются частями окружения.

Но всё же «интеллектуальная заливка» Adobe не способна достойно ретушировать множество вещей, в том числе не умеет заменять закрытые глаза открытыми: до сих пор это казалось слишком уж сложной задачей для автоматики. Facebook, в базе которой, вероятно, больше фотографий моргающих людей, чем у любой другой компании, решила взяться за эту проблему.

Речь идёт об использовании самообучающейся нейронной сети Generative Adversarial Network. Одна часть этой сети учится распознавать открытые глаза людей. А другая — заменяет закрытые глаза открытыми, и на основе отклика от системы распознавания добивается всё более и более высокой реалистичности работы ИИ-алгоритма. Ориентируясь на изображения-образцы, алгоритм добивается ещё большей реалистичности.

Слева направо: изображения-образцы, исходные фото, обработка алгоритмом Photoshop, метод Facebook

Слева направо: изображения-образцы, исходные фото, обработка алгоритмом Photoshop, метод Facebook

Результаты, как видно, вполне достоверны: нет несогласования цветов или очевидных мест вклейки. При проверке алгоритма в половине случаев люди ошибочно принимали фальшивые фотографии с открытыми глазами за настоящие, или не могли уверенно определить подвох. Если присмотреться, то в большинстве примеров видно, что с глазами и ресницами у людей что-то не то, но беглый взгляд легко может не увидеть проблемы.

В некоторых ситуациях алгоритм создаёт странные артефакты: например, когда глаза человека частично закрыты волосами или когда не выходит точно воссоздать цвет. Но всё это в перспективе может быть преодолено. Подобную технологию вполне можно представить в повседневном будущем: пользователь хочет улучшить групповое фото, и указывает алгоритму человека, которому следует «открыть глаза», ориентируясь на другие его снимки. Вполне полезная функция для пользователей Facebook, не правда ли?

Google может не продлить контракт по разработке военного ИИ

Не так давно обсуждалась новость о том, что Google заключила военный контракт, в рамках которого участвовала в разработке искусственного интеллекта для использования в беспилотниках. Такой ИИ планируется использовать для ускорения анализа записей с дронов путём классификации изображений объектов и людей. Этот контракт был довольно противоречивым, и несколько сотрудников Google подали в отставку в знак протеста, а тысячи подписали петицию против него.

Хорошей новостью для общественности, которая была обеспокоена ролью Google, а также для сотрудников поисковой компании, которые были против контракта, стало то, что компания не собирается продлевать свой контракт с военными после его завершения. По крайней мере, об этом сообщается в отчёте Gizmodo, источники которого сообщили им, что генеральный директор Google Cloud Дайан Грин (Diane Greene) объявила о таком решении во время встречи с сотрудниками.

Срок действия контракта истечёт в 2019 году, и после этого Google, как ожидается, больше не будет его продлевать. Господин Грин, по сообщению источника, сказал, что этому решению способствовала огромная негативная реакция, с которой столкнулась компания, и что проект был принят в то время, когда Google агрессивно боролась за военные контракты (пока не ясно, действуют ли они ещё).

Также утверждается, что Google намерена на этой неделе обнародовать новые этические принципы в отношении использования и разработки искусственного интеллекта. Компания, похоже, делает немалые успехи в развитии ИИ: Google, например, смогла привлечь большое внимание общественности во время недавних демонстраций своих разработок, в частности, Duplex, который способен обмануть людей, имитируя по телефону манеру беседы реального человека.

Samsung собирается добавить ИИ-возможности во все свои устройства к 2020 году

Samsung не без лишней скромности заявила о желании распространить функции искусственного интеллекта, такие как персональный помощник Bixby, за пределы своих мобильных устройств. Но как далеко южнокорейский гигант готов пойти? По-видимому, очень далеко: представитель компании Ким Хюн-сук (Kim Hyun-suk) сообщил ресурсу The Wall Street Journal, что, согласно планам, те или иные ИИ-функции будут доступны во всех продуктах Samsung к 2020 году.

Это будет достигнуто частично за счёт создания в ближайшие пару лет особой команды из 1000 инженеров, ориентированных на исследования и разработку в области ИИ. В рамках этой задачи ИИ-подразделение появится и в Москве. Теоретически это должно упростить использование множества самых разнообразных устройств Samsung и дать возможность компании выделить свои предложения на фоне менее продвинутых и не имеющих подключения к Сети конкурирующих продуктов.

Представитель южнокорейского гиганта также подчеркнул, что популярные сегодня интеллектуальные динамики не будут в перспективе настолько важны, потому что любое устройство в доме сможет, по сути, брать на себя эту роль.

Поможет ли это компании и удастся ли реализовать планы — вопрос другой. В настоящее время Bixby сильно уступает таким конкурирующим решениям, как Amazon Alexa или Google Assistant, отличаясь ограниченной функциональностью. Дебют Bixby 2.0 должен помочь, но Samsung предстоит ещё долгий путь, чтобы догнать соперников. Возможно, компания будет делать ставку на вездесущность своего ИИ в электронике, чтобы преодолеть недоверие публики к её ИИ, независимо от того, насколько быстро технология будет улучшаться.

Anidees AI Crystal XL AR: просторный корпус с панелями из закалённого стекла

Нидерландский производитель корпусов ПК Anidees продолжает радовать энтузиастов крупногабаритными моделями, такими как AI Crystal Cube Prismatic объёмом 50,5 л и AI Crystal XL AR объёмом 86,7 л. Последняя дебютирует на рынке совсем скоро, причём будущие владельцы смогут сделать выбор между её вариантами с предустановленными вентиляторами и без таковых.

AI Crystal XL AR позиционируется маркетологами Anidees как «большая башня для всего, что угодно». И действительно — за малым исключением данный корпус подойдёт для установки самых крупных материнских плат, воздушных процессорных кулеров, видеокарт, блоков питания и радиаторов СЖО. В рассматриваемом корпусе не поместятся только «экзотические» комплектующие вроде 200-мм вентиляторов и 560-мм радиаторов систем жидкостного охлаждения.

Габариты конструкции составляют 620 мм в длину, 235 мм в ширину и 595 мм в высоту, масса нетто равна 20 кг. Корпус преимущественно изготовлен из стали и закалённого стекла толщиной 5 мм. Полупрозрачные стеклянные панели находятся по бокам и спереди, все стальные поверхности окрашены в чёрный цвет. Помимо пылевого фильтра под посадочным местом для блока питания, предусмотрены ещё два более крупных магнитных пылевых фильтра спереди и сверху.

Новинка поддерживает любые матплаты для настольных ПК, многие для рабочих станций и некоторые серверные. Ограничение размера плат составляет по крайней мере 345,4 × 381 мм — именно столько занимает модель EVGA Classified SR-X (2012 года выпуска) с двумя процессорными разъёмами LGA2011. Кроме того, AI Crystal XL AR рассчитан на установку шести двухслотовых видеокарт (в том числе одной закреплённой вертикально), максимум пятнадцати 3,5-дюймовых или семнадцати 2,5-дюймовых накопителей, одного 120–140-мм и двух 120–480-мм радиаторов СЖО.

Режим работы пяти вентиляторов Anidees AI Aureola RGB типоразмера 120 мм регулируется с помощью реобаса с ИК-датчиком и трёхпозиционным переключателем на панели ввода-вывода. По соседству с переключателем находятся гнёзда Mini-Jack для наушников и микрофона, кнопки Power и Reset, по два порта USB 3.0 и USB 2.0.

Базовая версия AI Crystal XL AR доступна для предзаказа в странах Западной Европы по ценам от €249,90. Такой же корпус без вентиляторов стоит от €209,90. По своим возможностям и цене AI Crystal XL AR играет роль флагмана в семействе корпусов Anidees.

Facebook расширяет ИИ-усилия, открывая центры в Сиэтле и Питтсбурге

Следуя последним тенденциям и усиливая движение по пути интеграции в свои продукты технологий искусственного интеллекта и машинного обучения, крупнейшая в мире социальная сеть открыла новые лаборатории. Такие центры появились вблизи Вашингтонского университета в Сиэтле и Университета Карнеги-Меллона в Питтсбурге.

Университетские городки — весьма разумный выбор Facebook для привлечения новых исследователей и специалистов в области ИИ. Стоит отметить, что оба упомянутых высших учебных заведения известны своими исследовательскими программами в области технологий искусственного интеллекта.

Facebook собирается придерживаться в своих лабораториях подхода, когда специалисты, пришедшие в различные ИИ-проекты социальной сети из академических кругов, смогут продолжать свою работу в учебных заведениях. «Профессора получат различный опыт в отрасли, который сможет оказать положительное влияние на их студентов и исследования, — сказал директор Facebook по исследованиям ИИ Янн ЛеКун (Yann LeCun). — И наоборот, их связь с промышленностью поможет создать новые научные достижения, которые могут быть неосуществимы в академической среде, а также позволит превратить эти наработки в применимые на практике технологии».

У Facebook немало причин для активизации усилий в области ИИ. Заявления компании по вопросам конфиденциальности и безопасности, новые программы автоматической сортировки и упорядочения фотографий и видео (а также добавление компьютерных эффектов) и многие другие инициативы всё чаще полагаются на ИИ. Кроме того, Google, Apple и Amazon тоже используют ИИ для расширения возможностей различных продуктов и приложений. Новые ИИ-лаборатории Facebook присоединятся к существующим в Кремниевой долине, Нью-Йорке, Париже и Монреале.

«Яндекс.Алиса» научилась заказывать такси

Команда разработчиков «Яндекса» сообщила об очередных усовершенствованиях голосового ассистента «Алиса» и включении в состав AI-сервиса функции вызова такси посредством мобильного приложения «Яндекс.Такси».

Теперь для вызова такси достаточно надиктовать сообщение голосовому помощнику и сказать, куда нужно ехать. «Алиса» уточнит указанный адрес и откроет упомянутое выше приложение, где уже будет заполнена строка «Куда». При этом «Алиса» сама определит текущее местоположение пользователя и укажет его при составлении маршрута в качестве отправной точки.

К голосовому ассистенту можно обращаться по-разному: «вызови такси», «закажи такси», «поехали на такси». «Алисе» можно назвать конкретные адреса или названия мест (Макдональдс, музей, кинотеатр). Также AI-помощник может вызвать такси домой или на работу: в первый раз «Алиса» уточнит адрес, а потом запомнит и будет указывать его в приложении «Яндекс.Такси» не переспрашивая.

Голосовой ассистент «Алиса» был запущен компанией «Яндекс» в октябре прошлого года. Сервис представляет собой альтернативу аналогичным решениям Apple (Siri), Google (Google Assistant), Amazon (Alexa) и в настоящий момент представлен для платформ Windows, Android, iOS. Созданная отечественными программистами помощница умеет искать информацию в Интернете, давать ответы на интересующие пользователя вопросы, беседовать на отвлечённые темы, подсказывать удобный маршрут, сообщать прогноз погоды, помогать в решении повседневных задач и даже играть в игры, такие, как «Угадай песню», «Слова», «Верю — не верю», «Города», «Этот день в истории» и некоторые другие.

Видео: ИИ в Huawei Mate 10 Pro управляет машиной и объезжает собак

Huawei не раз рассказывала о специализированных ИИ-возможностях своей однокристальной системы Kirin 970, впервые увидевшей свет в серии Huawei Mate 10. Благодаря интегрированному блоку, ускоряющему алгоритмы машинного обучения, Mate 10 умеет идентифицировать объекты и сцены для автоматической настройки параметров камеры. Но для того, чтобы доказать, насколько продвинутым является её блок ИИ (и, конечно, система камер), Huawei пошла на неожиданный эксперимент.

Компания подключила Mate 10 Pro к модифицированному Porsche Panamera не только для идентификации объектов на дороге, но и для управления импровизированным самоходным автомобилем, а также для уклонения от препятствий. В наши дни смартфоны способны исполнять самые разные задачи благодаря огромным мощностям. В будущем они, похоже, смогут также управлять автомобилями, устраняя необходимость во встроенных системах автопилота и искусственного интеллекта. Это, конечно, отдалённая, но технически вполне достижимая возможность. Более того, такой автопилот куда легче обновлять по сравнению со встроенными системами.

Обычные самоходные автомобили полагаются на различные датчики, и лицевая камера — лишь один из них. В своей демонстрации, впрочем, Huawei довольствуется исключительно возможностями Mate 10 Pro, расположенного на приборной панели камерами вперёд, в сторону движения. Цель демонстрации — идентифицировать объект на пути автомобиля и, при необходимости, осуществить манёвр уклонения.

Конечно, история была бы печальной, если бы бедная собака во время теста попала в аварию. Но дело закончилось хорошо, как и было запланировано. Это впечатляет, учитывая тот факт, что на разработку системы автопилота (пусть и достаточно простого) у Huawei ушло лишь пять недель. Конечно, для создания настоящего самоходного автомобиля на базе смартфона нужно научить его анализировать дорожную ситуацию сразу с десятка камер и датчиков, но цель демонстрации была просто показать принципиальную возможность такого развития событий.

Кстати, Huawei сотрудничает с китайским интернет-гигантом Baidu в области искусственного интеллекта. А учитывая разработку компанией Baidu автопилота для машин, наработки Huawei и её чипы вполне могут появиться в каком-нибудь китайском автомобиле.

Демонстрация беспилотной системы вождения закончилась аварией

30 января съёмочная команда издания TechCrunch принимала участие в демонстрации системы автономного вождения автомобиля Phantom AI. Авария произошла недалеко от Милбро, штат Калифорния. Автомобиль Hyundai Genesis, оснащённый системой ADAS (система продвинутого ассистента водителя), двигался по шоссе в режиме SAE L2. Этот режим подразумевает частичную автоматизацию, при которой система управляет автомобилем, но контролировать движение должен сам водитель.

Перед тестовой Hyundai Genesis двигался белый кроссовер Nissan Rogue. Его водитель вынужден был резко затормозить, чтобы не врезаться в мусорный бак, выпавший из кузова едущего впереди пикапа. За рулём Hyundai Genesis, в котором ехала команда TechCrunch, находился Чан Кю Ли, сооснователь Phantom AI. Он попытался резко затормозить, но силы нажатия на педаль тормоза было недостаточно, чтобы предотвратить столкновение. В аварии никто не пострадал.

По словам, Хьюнги Чо, другого сооснователя Phantom AI, также находившегося в машине, авария произошла из-за отключенной перед демонстрацией системы автоматизированного экстренного торможения. Отключили её из-за частых ложных срабатываний и необходимости более точной настройки. «Оглядываясь назад, мы понимаем, что должны были включить функцию экстренного торможения. Это было бы редкой возможностью протестировать и продемонстрировать нашу автоматизированную тормозную систему, которая бы сработала бы значительно лучше» — говорится в официальном заявлении Phantom AI.

Hyundai Genesis

Hyundai Genesis

Несмотря на аварию, сотрудникам TechCrunch было предложено продолжить демонстрацию, но уже на другом Hyundai Genesis. В этом автомобиле был включен более высокий уровень автономности — SAE L4, где управление и контроль за ездой автомобиля полностью отводится системе. Эта поездка прошла без инцидентов.

Google наконец начала продавать камеру Clips

Google во время анонса Pixel 2 представила также и другие продукты, включая небольшую камеру Clips, призванную помочь пользователю оставаться на связи за счёт автоматической интеллектуальной съёмки фотографий и видео. Теперь компания наконец начала принимать предварительные заказы на свой необычный продукт.

Миниатюрная камера отличается размерами всего 49 × 49 × 20 мм при массе 42 г (с подключённой подставкой-креплением — 61 г). В основе лежит технология машинного обучения Moment IQ, благодаря чему со временем устройство должно работать лучше: в частности, оно будет узнавать знакомые лица людей, с которыми пользователь общается или видится чаще других. Записанные данные хранятся непосредственно на камере (в наличии 16 Гбайт встроенного пространства) и могут быть переброшены на смартфон с помощью Wi-Fi Direct.

В Google Clips используется 12-Мп сенсор с диафрагмой объектива f/2,4 и углом обзора в 130°. Возможность онлайн-трансляции с камеры на мобильную электронику или ПК не предусмотрена. Как и в случае с GoPro, устройство можно использовать для съёмки (в том числе автопортретов) с уникальных перспектив. Камера может снимать до 15 кадров/с в течение 3 часов на одном заряде.

В целом, Clips создаёт впечатление экспериментального продукта. Стоит добавить, что он оказался недешёвым: Google начала приём предварительных заказов по цене $250 в США. За эту цену можно приобрести неплохую спортивную камеру от GoPro или даже смартфон средней руки, так что оправдать эти затраты может только технология автоматической интеллектуальной съёмки. Насколько идея самоустранения от процесса фотографии окажется привлекательной и удобной на практике, покажет время и реакция конечных пользователей.

Музейное приложение Google поможет найти по автопортрету похожий предмет искусства

Многим любопытно, много ли в мире найдётся схожих с их автопортретами лиц на выставленных в музеях картинах или скульптурах. Теперь нанести болезненный удар своему самолюбию очень просто — Google приготовила для этого специальное приложение. Точнее, такая функция появилась в последнем обновлении Arts & Culture — программе с онлайн-доступом к экспонатам из 1200 музеев, галерей и других организаций в 70 странах мира.

Kumail Nanjiani/Twitter

Kumail Nanjiani/Twitter

Теперь пользователь может сделать автопортрет, а технологии распознавания лиц поискового гиганта найдут наиболее похожее изображение из огромной коллекции. Затем Arts & Culture выведет рядом фотографию пользователя и картину или иной предмет искусства с лицом, а также степень сходства (по мнению алгоритма, разумеется) — такими сравнениями можно будет поделиться в социальной сети.

stevetdent/Instagram

stevetdent/Instagram

Во некоторых случаях запечатлённые на картинах и преимущественно давно умершие люди весьма сильно напоминают наших современников, но часто приложение подбирает картины, персонажи которых совершенно не похожи или могут испугать. Новая функция уже вызвала резонанс в Сети — одни результатом удовлетворены, другие воспринимают сравнение как личное оскорбление, а многие просто озадачены работой алгоритма.

mxavren/Instagram

mxavren/Instagram

Тем не менее, эксперимент Google по привлечению общественного внимания к мировому культурному наследию оказался весьма любопытным. Судя по нему, алгоритмы распознавания лиц пока далеко не совершенны, хотя прогресс очевиден. К сожалению, пока такая возможность доступна не во всех регионах — возможно, в перспективе компания расширит географию.

Amy Stone/Twitter

Amy Stone/Twitter

boywonderrocks/Instagram

boywonderrocks/Instagram

ИИ Google сможет оценивать эстетическую привлекательность фотографий

Как хорошо машины могут интерпретировать красивые пейзажи? В конце концов, некоторые виды красивы просто потому, что вызывают эмоции у людей, чего компьютеры лишены. Другие пейзажи вроде песчаных дюн для робота слишком напоминают обнажённую натуру. Чтобы решить эти сложности, Google представила нейронную оценку наиболее эстетически привлекательных изображений.

Этот алгоритм стал результатом глубинного обучения нейронной сети на основе данных, помеченных людьми. Он научен предсказывать, какие изображения среднестатистический пользователь посчитает хорошо выглядящими с технической точки зрения или же эстетически привлекательными.

Технология, по словам Google, может быть использована для интеллектуального редактирования и улучшения визуального качества фотографий, исправления визуальных ошибок изображения с точки зрения восприятия. Речь идёт, в частности, о рекомендациях оптимального уровня яркости, детализации светлых и тёмных тонов.

Оценки ИИ Google основываются на эталонных фотографиях, если таковые доступны. Если же нет, используется статистический метод для предсказания качества фотографии. Цель поискового гиганта — добиться от алгоритма того, чтобы автоматическая оценка качества снимка совпадала с человеческим восприятием, даже если изображение подверглось искажениям.

Фотография с различными степенями искажений

Фотография с различными степенями искажений

Однажды, как надеется компания, искусственный интеллект будет помогать пользователям с выборкой наиболее удачных снимков из массива, а также предоставлять в реальном времени оценку той или иной фотографии (даже на этапе съёмки). Но пока эти модели и алгоритмы остаются внутренними концептуальными наработками, результатами которых компания поделилась в научной публикации.

window-new
Soft
Hard
Тренды 🔥