Теги → машинное обучение
Быстрый переход

Новый суперкомпьютер Tesla позволит робомобилям избавиться от радаров и лидаров

Компания Tesla поделилась информацией о новом вычислительном кластере, который используется для создания сложных алгоритмов искусственного интеллекта (ИИ), связанных с функционированием системы автопилотирования. О суперкомпьютере в ходе конференции по компьютерному зрению и распознаванию образов CVPR 2021 рассказал Андрей Карпати, руководитель ИИ-подразделения Tesla.

https://electrek.co

https://electrek.co

Описанная система объединяет 720 узлов, каждый из которых содержит восемь ускорителей NVIDIA A100 с тензорными ядрами и 80 Гбайт памяти. В общей сложности задействованы 5760 ускорителей на графических процессорах.

Теоретическое пиковое быстродействие суперкомпьютера достигает 1,8 Эфлопс. С таким результатом система могла бы занять пятое место в рейтинге мощнейших вычислительных комплексов мира Тор500.

Ещё одна составляющая платформы — высокопроизводительное хранилище на основе твердотельных накопителей NVMe суммарной ёмкостью 10 Пбайт. Оно обеспечивает пропускную способность на уровне 1,6 Тбайт/с.

NVIDIA

NVIDIA

Нужно отметить, что ускорители NVIDIA A100 обеспечивают высочайшее быстродействие при обработке алгоритмов ИИ и глубокого обучения. Компания Tesla использует систему для тренировки автопилота нового поколения, который сможет довольствоваться лишь оптическими камерами высокой чёткости. Иными словами, такому автопилоту не потребуются радары и лидары — он сможет принимать решения и контролировать обстановку на основе видеоряда, получаемого от восьми датчиков изображений, расположенных по периметру машины.

Добавим, что до конца текущего года Tesla намерена запустить новый суперкомпьютер экзафлопсного класса, который создаётся по проекту Dojo. Он будет применяться для дальнейших исследований в области ИИ. 

Facebook создала инструмент для распознавания дипфейков, позволяющий вычислить автора подделки

Для Facebook дипфейки (поддельные изображения, созданные ИИ) в настоящий момент не являются большой проблемой, однако компания продолжает финансировать исследования, связанные с этой технологией, чтобы иметь возможность защититься от потенциальных угроз в будущем. Одна из последних работ в этом направлении была проведена вместе с учёными из Университета штата Мичиган. Команда специалистов разработала метод декомпиляции дипфейков.

Специалисты объясняют, что их технология позволяет проводить анализ изображений, созданных алгоритмами ИИ, и выявлять идентифицирующие характеристики модели машинного обучения, с помощью которой была создана конкретная подделка.

Программа полезна тем, что в перспективе сможет помочь Facebook отслеживать злоумышленников, распространяющих дипфейки с различными преступными целями. Например, пользователей могут шантажировать с помощью поддельных интимных фото или видео. Отмечается, что разработка декомпилятора дипфейков ещё не завершена, поэтому программа пока не готова к развёртыванию.

Предыдущие исследования в этой области позволили определить, какая из известных моделей ИИ сгенерировала тот или иной дипфейк, однако новая разработка специалистов из Facebook и Университета штата Мичиган лучше подойдёт для практического применения. Она позволяет определять архитектурные особенности систем для создания дипфейков, основанные на неизвестных моделях. Эти характеристики, известные как гиперпараметры, присутствуют в каждой модели машинного обучения. В совокупности они создают уникальный отпечаток на готовом изображении, который затем можно использовать для определения источника дипфейка.

По словам ведущего специалиста Facebook Тала Хасснера (Tal Hassner), участвующего в проекте разработки декомпилятора дипфейков, возможность выявления особенностей неизвестных моделей очень важна, поскольку ПО для дипфейков очень легко изменять, что позволяет злоумышленникам эффективно заметать следы.

Несуществующие люди, созданные программой для генерации дипфейков (Изображение: The Verge)

Несуществующие люди, созданные программой для генерации дипфейков (Изображение: The Verge)

«Предположим, злоумышленник создаёт множество разных дипфейков и загружает их на разные платформы под видом разных пользователей. Если для создания дипфейков применялась новая модель ИИ, которую никто раньше не видел, то выяснить все детали, связанные с созданием изображения будет невозможно. С новой технологией мы можем определить, что загруженное на разные платформы изображение было создано одной и той же моделью машинного обучения. А получив доступ к ПК, на котором это изображение было создано, мы сможем уверенно указать на виновника», — объяснил Хасснер.

Хасснер сравнивает свою разработку с методом экспертно-криминалистического анализа, использующегося для определения модели фотоаппарата, с помощью которого были произведены снимки. Суть анализа заключается в поиске на этих снимках определённых закономерностей или оптических дефектов, создаваемых только конкретной моделью камеры.

«Не каждый может создать свою собственную камеру, но любой, кто обладает достаточным опытом и доступом к обычному ПК, может создать свою собственную модель для генерации дипфейков», — добавляет Хасснер.

Созданный учёными из Университета штата Мичиган и Facebook алгоритм способен не только определять черты той или иной генеративной модели, но также выяснять, какая из известных моделей могла применяться в создании дипфейка и является ли вообще представленное изображение подделкой. По словам Хасснера, система обладает весьма высоким показателем эффективности. Однако точных значений не приводит.

Следует указать, что даже самые современные алгоритмы определения дипфейков в настоящий момент далеки от совершенства. И сами специалисты, занимающиеся этим вопросом, прекрасно это осознают. Когда в прошлом году Facebook проводила конкурс, посвящённый поиску дипфейков, победителем оказался алгоритм, который мог определять недостоверность изображений только в 65,18 % случаев. Частично это объясняется тем, что область разработки генеративного ИИ очень активно развивается. Новые методы публикуются практически каждый день и фильтры распознавания попросту за ними не поспевают.

Google научила ИИ проектировать компьютерные чипы — результат оказался лучше, чем у человека

Исследователи из Google обнаружили, что искусственный интеллект (ИИ) способен разрабатывать полноценные микросхемы, и потенциально может делать это более эффективно, чем живые специалисты в этой области.

В статье, опубликованной в журнале Nature, команда из Google Research объясняет, что процесс проектирования физического макета компьютерного чипа является очень трудоёмкой и времязатратной, но в то же время очень важной задачей. Для повышения эффективности исследователи использовали технологии машинного обучения.

Специалисты Google разработали серию алгоритмов и научили их воспринимать проектирование чипа в качестве игры по складыванию пазла, в которой детали — это базовые компоненты будущей микросхемы. Главная цель игры состояла в достижении определённого порога качества и эффективности готовой схемы. Оценка этих показателей проводилась на основе набора из 10 тыс. уже готовых проектов микросхем, которые исследователи дали алгоритмам в виде тренировочного материала до начала эксперимента.

Слева — схема чипа, разработанного человеком, слева — алгоритмом машинного обучения

Слева — схема чипа, разработанного человеком, справа — алгоритмом машинного обучения

Если на проектирование микросхемы живым человеком могут потребоваться месяцы, то алгоритмы ИИ справились с этой задачей всего за шесть часов. При этом готовые схемы оказались аналогичными, а в некоторых случаях даже более эффективными, чем те, что были разработаны настоящими специалистами.

«Наш метод позволил сгенерировать физический макет чипа примерно за шесть часов. Обычно такие задачи требуют месяцы работы экспертов-людей», — отметили исследователи из Google Research в своей статье.

По словам исследователей, метод не только сокращает время разработки, но также позволяет увеличить качество конечного результата, поскольку алгоритмы позволяют более точно решать задачи по нужному расположению и объединению компонентов, составляющих микросхемы. В своей статье эксперты из Google Research также отметили, что метод использования ИИ уже применялся на практике при разработке последнего поколения тензорного процессора Google.

Компания ещё в прошлом году сообщила о том, что экспериментирует с ИИ при разработке своих чипов. Глава отдела искусственного интеллекта Джефф Дин (Jeff Dean) тогда отмечал, что такой подход позволит снизить финансовые затраты на разработку и в то же время поможет создавать более эффективные дизайны микрочипов.

«Мы поручили нашим инженерам поэкспериментировать с этим методом, и хотим посмотреть, как они смогут адаптировать его под свои рабочие процессы», — заявил Дин.

Нейросеть будет следить за школьной жизнью подмосковных учеников

До конца текущего года в Подмосковье будет реализован проект «интеллектуального» обеспечения безопасности с помощью нейросети отечественной разработки. Система заработает в одной из местных школ.

profile.ru

profile.ru

По данным издания «Профиль», нейросеть будет отслеживать общую обстановку в учебном заведении, состояние его инфраструктуры, питание детей и даже оказание им медицинской помощи.

При этом система «предикативной безопасности», разработанная одной из российских IT-компаний, организует буквально тотальный мониторинг поведения. С помощью камер будут идентифицировать «нетипичное» поведение детей, опасные ситуации — таковыми будут считаться даже бег по коридору и, например, катание по перилам.

Если система распознает опасную ситуацию, немедленно получат оповещение педагоги и представители школьной администрации. При этом для оценки психоэмоционального состояния ученика будут учитываться множество факторов, включая школьные оценки и его поведение.

Место тестирования системы пока остаётся неизвестным. В Подмосковье на данный момент ведётся инженерное обследование гимназии, расположенной на северо-западе региона.

Google использует ИИ для распознавания заболеваний кожи и туберкулёза

Алгоритмы искусственного интеллекта (ИИ) уже давно применяются в медицинских целях, в том числе — для диагностики различных заболеваний. Новые разработки Google представляют собой наборы программных инструментов для определения проблем с кожей и туберкулёза.

cbc.ca

cbc.ca

Используя технологию Google, кожные заболевания можно диагностировать буквально с помощью камеры смартфона. В компании заявляют, что те или иные проблемы подобного характера имеют миллиарды людей, но из-за нехватки специалистов незаменимыми становятся аппаратно-программные диагностические комплексы.

Пользователь может просто сделать три снимка проблемного участка кожи с различных ракурсов, ответить на несколько вопросов — на основе полученных данных ИИ максимально сузит круг из сотен возможных диагнозов для дальнейшего рассмотрения результатов анализа специалистами.

neowin.net

neowin.net

Как сообщают в Google, искусственный интеллект обучали на основе миллионов снимков, относящихся к разным демографическим группам, но пока технология имеет только вспомогательное значение. Разработку рассмотрели в Управлении по контролю за продуктами и лекарствами США, но она не может служить полноценной заменой визита к врачу-профессионалу. Пилотную «обкатку» инструмента в полевых условиях Google намерена провести позже в этом году.

Для диагностики туберкулёза и последующего направления потенциальных пациентов на дополнительные обследования Google использовала системы глубокого обучения. ИИ анализирует рентгеновские снимки грудной клетки до того, как человека направят для прохождения более дорогих специальных тестов.

neowin.net

neowin.net

По данным Google, разработанная компанией технология выдаёт не больше ложноположительных и ложноотрицательных результатов, чем 14 участвовавших в исследовании рентгенологов. Для создания системы искусственного интеллекта Google применила «обезличенные» данные из девяти стран, а потом проверила обученный «интеллект» на пациентах из пяти стран. Если врачи не посчитают результаты оценки Google по умолчанию заслуживающими доверия, они могут самостоятельно решать, направлять пациентов на дополнительные обследования или нет.

Здесь можно загрузить полный доклад о технологии. В дальнейшем компания намерена расширить исследование за счёт партнёрства с больницами в Индии и Замбии.

Запущена платформа Marvel.AI, позволяющая знаменитостям клонировать голос с помощью ИИ для использования в рекламе

Участие в рекламных кампаниях по продвижению новых продуктов и сервисов сегодня для многих знаменитостей является неотъемлемой частью их доходов. Однако у популярных блогеров, спортсменов и прочих известных личностей не всегда хватает свободного времени на подобные мероприятия. Американская компания Veritone решила этим воспользоваться. Она разработала платформу Marvel.AI, которая позволяет записывать копии своего голоса, а затем лицензировать их по своему усмотрению.

«Люди хотят принимать участие в рекламе, но у них не всегда хватает времени для того, чтобы посетить студию и записать необходимый рекламный контент. Блогеры, спортсмены, актёры, музыканты и прочие знаменитости — все они представляют собой огромный актив, являющийся частью своих брендов», — прокомментировал глава компании Veritone Райан Стилберг (Ryan Steelberg) изданию The Verge.

По его словам, с помощью Marvel.AI любой желающий сможет создать реалистичную копию своего голоса и использовать её для получения дохода. Пока человек спит, его голос может зачитывать спортивные сводки, озвучивать литературные произведения и многое другое. Стилберг заявляет, что платформа даже может воссоздавать голоса уже давно умерших знаменитостей. В этом случае ИИ-модель обучается на архивных голосовых записях того или иного человека.

Портал The Verge попросил Стилберга предоставить несколько примеров работы Marvel.AI. С ними можно ознакомиться в источнике. В первом отрезке текст зачитывает сам Стилберг. Второй — продукт работы Marvel.AI. В третьем отрезке алгоритм изменил пол говорящего. По мнению журналиста издания Джемса Винсента (James Vincent), текст, зачитанный ИИ, является очень хорошей имитацией голоса Стилберга, но не идеальной копией. Голос, созданный алгоритмом, получился более плоским, резким и безэмоциональным по сравнению с настоящим.

Насколько удачным окажется проект Veritone зависит от потенциала ИИ-алгоритмов компании. По словам Стилберга, компания обладает всеми необходимыми ресурсами и опытом для быстрой адаптации любых новых моделей машинного обучения, связанных с синтезированием речи, которые создаются сегодня и будут создаваться в будущем. Поэтому платформа Marvel.AI в перспективе продолжит развиваться.

Успех рекламной компании в немалой степени зависит от того, насколько убедительно знаменитость рекламирует продукт, какие эмоции при этом демонстрирует, а также от того, поверит ли клиент в то, что его любимому актёру или спортсмену на самом деле нравится тот продукт, что рекламируется. Это вопрос тонкой психологии.

По мнению Стилберга, одним из решений может являться разработка своего рода отраслевого стандарта, в виде некоего звукового сигнала, который будет воспроизводиться перед началом синтетической речи знаменитости и уведомлять слушателя в том, что голос не настоящий, но его владелец полностью одобряет его использование.

«Задача состоит не только в том, чтобы избежать обмана потребителя, но ещё и в том, чтобы убедить потребителя, что владелец голоса полностью одобряет использование синтетического контента», — говорит Стилберг.

Для американских военных сделали детектор сарказма

Сарказм непросто понять при живом общении и ещё труднее при онлайн-переписке, не говоря о важности наличия чувства юмора для его понимания. Поэтому научить машинные алгоритмы различать сарказм представлялось неподъёмной задачей, однако по заданию Министерства обороны США эта задача была успешно решена. Теперь ИИ может обнаружить сарказм в любых текстовых сообщениях на любых языках, и вот почему это важно для обороны.

Источник изображения: DARPA

Источник изображения: DARPA

«Сарказм был серьезным препятствием на пути повышения точности анализа настроений, особенно в социальных сетях, поскольку сарказм в значительной степени зависит от тональности голоса, мимики и жестов, которые не могут быть представлены в тексте, — сказал Брайан Кеттлер (Brian Kettler), менеджер программы DARPA. — Распознать сарказм в текстовом онлайн-общении — непростая задача, поскольку ни один из этих сигналов недоступен».

Решили проблему исследователи из Университета Центральной Флориды, работающие над программой DARPA Computational Simulation of Online Social Behavior (SocialSim). «Детектор сарказма» был разработан на базе искусственного интеллекта. Модель использовала нейронные сети для отслеживания зависимости между ключевыми словами, а затем выдавала классификационную оценку, указывающую, присутствует ли сарказм. Работа с популярными наборами данных и с некоторыми особенными наборами показала, что сарказм в текстовых выражениях определяется ИИ почти со стопроцентной точностью.

Всё это нужно, прежде всего, для отслеживания настроений в социальных сетях и для своевременного запуска информационного противодействия, если где-то что-то начинает идти не так. «Понимание настроения онлайн-разговоров может помочь предприятиям обрабатывать отзывы клиентов и собирать идеи для улучшения своих маркетинговых усилий. — говорится в пресс-релизе DARPA. — С точки зрения обороны настроения могут быть важным сигналом для информационных операций в сети, чтобы определить вызывающие озабоченность темы или возможные действия злоумышленников».

С другой стороны, научить ИИ понимать чувства и настроения человека и, очевидно, имитировать их при общении с ним — это прорыв в новые области машинного обучения и искусственного разума. Хотя военные со всем этим могут сделать такое, что мало никому не покажется.

Соучредитель ARM предположил, почему все боятся покупки ARM компанией NVIDIA

Война за право владения интеллектуальной собственностью компании ARM длится ещё с прошлого года. NVIDIA пытается получить разрешение на полный выкуп, а конкуренты и регуляторы всячески этому препятствуют. Герман Хаузер, соучредитель ARM, попытался предположить, почему все так боятся этой сделки.

На разработках компании ARM и одноименном наборе инструкций строится практически весь рынок смартфонов. Также у ARM есть перспективы в компьютерах и на серверном рынке. Именно поэтому NVIDIA уже который месяц борется за разрешение на приобретение этой компании. Чтобы успокоить регулирующие органы от правовых аспектов, американский производитель графических процессоров обещает не вмешиваться в оригинальную бизнес-модель ARM и даже собирается построить в Кембридже ведущий исследовательский центр ИИ, который останется на балансе ARM. Тем не менее переговоры между NVIDIA и регулирующими органами по всему миру пока не достигли консенсуса. И этому есть объяснение.

По словам соучредителя ARM Германа Хаузера, недавно представленный NVIDIA процессор Grace для машинного обучения является доказательством того, что компания склонна к монополизации рынка, если ей будет разрешено провести покупку. Он считает, что технологический гигант может сделать проприетарный интерфейс NVLink эксклюзивным для своих ARM-процессоров (для подключения своих же GPU), что создаст неравные условия на рынке серверных устройств.

Впрочем, это всего лишь предположение компетентного специалиста, который пытается рассудить действия компании и предугадать возможные ходы. Тем более, NVIDIA ещё не получила право на приобретение ARM, да и NVLink существует ещё с 2014 года, и не совсем ясно, как именно он может навредить рынку.

И все же, остальные игроки на рынке электроники скорее согласны с мнением Германа Хаузера и постоянно выражают обеспокоенность по поводу сделки между ARM и NVIDIA. Компании Google, Qualcomm и другие сомневаются, что NVIDIA сможет честно конкурировать, имея под рукой богатый опыт ARM. Пока никто не может назвать конкретных причин, но страх перед совершением такой крупной сделки есть у всех. Тем более всех пугает тот факт, что NVIDIA уже разработала, представила и собирается выпустить свой первый процессор ARM, даже несмотря на трудности со сделкой.

Китай создал самую большую в мире базу спутниковых изображений и отдал ее искусственному интеллекту

В Китае создана база данных FAIR1M из спутниковых изображений в высоком разрешении, которая заявлена как самая большая в мире. Она в десятки и даже сотни раз превышает предыдущие наборы данных для обучения ИИ. С помощью новой базы можно обучить ИИ определять объекты с точностью до идентификации моделей самолётов и назначения сооружений. База FAIR1M — это разработка для гражданских целей и будет открыта для всех желающих.

Источник изображения: Chinese Academy of Sciences

Источник изображения: Chinese Academy of Sciences

В базе FAIR1M около 80 % изображений в высоком разрешении получены с помощью китайских спутников дистанционного зондирования земли «Гаофэнь». Эти спутники Китай запускает с 2013 года, и сегодня они являются для Китая основными поставщиками высококачественных изображений Земли из космоса. Остальные 20 % изображений для базы FAIR1M были взяты из Google Earth. База насчитывает 15 тыс. изображений с одним миллионом объектов, помеченных как «сцена». До этого крупнейшей подобной базой была французская VEDAI с выделением 3600 сцен.

Распознавание сцены сложнее, чем идентификация объекта. В случае сцены необходимо оценить несколько объектов на изображении, связать их и определить контекст. Китайская база FAIR1M позволяет обучить ИИ на примере целого миллиона выделенных вручную сцен, что открывает перед разработчиками алгоритмов распознавания массу возможностей.

Если верить китайским источникам, база FAIR1M выбрана Международным обществом фотограмметрии и дистанционного зондирования в качестве эталона для обучения ИИ. Международному сообществу база FAIR1M будет открыта в июне этого года. Разработчики признаются, что FAIR1M слабее аналогичных по назначению военных баз, но быстро их догоняет и оперирует намного большим числом объектов, которые можно распознать.

«Яндекс» и НИУ ВШЭ сформируют лабораторию естественного языка

Компания «Яндекс» и НИУ ВШЭ в Санкт-Петербурге (Национальный исследовательский университет «Высшая школа экономики») сформируют Лабораторию естественного языка, появление которой должно способствовать развитию лингвистических технологий в эпоху цифровизации.

Специалистам предстоит исследовать тексты на естественном языке, разрабатывать алгоритмы глубокого обучения для их генерации и анализировать данные в компьютерной лингвистике. Кроме того, сотрудники лаборатории займутся разработкой математического аппарата, необходимого для описания генеративных языковых моделей.

Лаборатория создаётся на базе Санкт-Петербургской школы физико-математических и компьютерных наук НИУ ВШЭ — Санкт-Петербург. Её руководителем станет Иван Ямщиков, научный сотрудник «Яндекса» и доцент НИУ ВШЭ — Санкт-Петербург.

Важно отметить, что новая лаборатория станет одной из немногих в России, где займутся именно обработкой естественного языка. Результаты исследований в числе прочего помогут улучшить работу голосовых ассистентов и средств аналитики документов.

«Яндекс» в рамках проекта будет помогать привлекать ведущих специалистов в области искусственного интеллекта и анализа данных для работы в лаборатории на долгосрочной основе. Ожидается, что теоретические и прикладные направления работы новой структуры будут взаимно дополнять друг друга. 

NVIDIA предложила использовать машинное обучение для тактильной обратной связи в играх

Компания NVIDIA рассматривает возможность использования искусственного интеллекта для совершенствования технологии тактильной обратной связи в видеоиграх. Об этом сообщил журнал PC Gamer, обнаруживший соответствующий патент компании. В документе специалисты NVIDIA предлагают использовать новый подход к реализации тактильной обратной связи посредством машинного обучения.

В патенте обращается внимание, что сейчас разработчики видеоигр заранее программируют моменты срабатывания эффектов обратной связи или связывают их с определёнными звуковыми частотами внутри аудиозаписей игры. Вместо этого NVIDIA предлагает обучить искусственный интеллект обнаруживать определённые «особенности» внутри игры в реальном времени и сопоставлять их с различными вариантами тактильной обратной связи.

Патент практически не предоставляет никаких деталей о том, как это будет работать. Вероятно, задачи по обработке алгоритмов тактильного управления будут возлагаться на центральный процессор или на GPU, либо на комбинацию аппаратного и программного обеспечения.

Первоначальный алгоритм тактильной отдачи на основе искусственного интеллекта, какую бы форму он ни принимал, потребует предварительного обучения, которое позволит ему освоить некоторые игровые особенности, например, видеоизображения, объекты и аудиосигналы внутри игры. После этого он сможет подстраиваться на лету без предварительного знания той или иной видеоигры.

«Эффекты обратной связи могут быть заранее определены в соответствии с определённой особенностью. Такой особенностью может быть, например, выстрел, совершаемый в игре. Распознав его, алгоритм тактильного управления подаст на игровой манипулятор определённый эффект обратной связи, таким образом координируя эффект отдачи игрока с отдачей, которую испытывает игровой персонаж в видеоигре», — говорится в патенте.

Google представила аудиокодек Lyra для голосовых звонков по очень медленным каналам связи

Компания Google представила бета-версию аудиокодека Lyra, который использует машинное обучение для достижения максимального качества передачи речи даже при использовании очень медленных каналов связи. Исходный код Lyra, а также примеры его работы, компания опубликовала на платформе GitHub. Отмечается, что для передачи необработанного звука необходим канал связи со скоростью всего 3 Кбит/с.

Код Lyra написан на C++ с использованием фреймворка Bazel. В текущей версии аудиокодека используется проприетарная библиотека libsparse_inference.so с реализацией ядра для математических вычислений в среде специализированных инструкций, доступных в 64-разрядных процессорах ARM. Компания отмечает, что это временная мера и в дальнейшем планируется разработать открытую замену вышеуказанной библиотеке и обеспечить поддержку различных платформ.

Кодек состоит из кодировщика и декодировщика. Алгоритм работы первого заключается в извлечении параметров голосовых данных каждые 40 миллисекунд, их сжатию и передаче получателю по сети. Задача декодера сводится к преобразованию этих порций данных обратно в звуковую волну, которую можно воспроизвести на стороне слушателя.

По словам Google, архитектура Lyra в большей степени похожа на архитектуру традиционных аудиокодеков, использующих обычные методы сжатия звука. Преимущество Lyra заключается в способности декодеровщика восстанавливать высококачественный сигнал с помощью генеративной системы машинного обучения. Она позволяет воссоздавать недостающую информацию на основе типовых характеристик речи. Модель для генерации звука обучена на основе нескольких тысяч часов с записями голосов на более чем 70 языках. 

По мнению Google, аудиокодек Lyra может применяться в разных сферах. Например, его можно применять для архивирования больших объёмов записи речи, для экономии заряда аккумулятора в смартфонах, а также для снижения нагрузки на Сеть в случаях чрезвычайных ситуаций.

NVIDIA RTX Voice для интеллектуального шумоподавления официально заработало на видеокартах GeForce GTX

По какой-то причине NVIDIA без лишнего шума исправила своё приложение RTX Voice, добавив в него официальную совместимость со всеми видеокартами GeForce GTX, поддерживаемыми драйвером NVIDIA 410.18 или более свежим. Это означает, что RTX Voice теперь работает со всеми продуктами — от новейших видеокарт серии GeForce RTX 3000 до GeForce GTX 600.

NVIDIA выпустила RTX Voice год назад в качестве новой особой функциональности графических процессоров GeForce RTX 20-й серии — оно позволяет улучшать качество аудиосвязи за счёт интеллектуального снижения нежелательного фонового шума на основе машинного обучения. NVIDIA заявила, что для выполнения этой работы приложение задействует тензорные ядра, встроенные в её последние продукты.

Но, по иронии судьбы, сразу после выхода приложения появилась крайне простая модификация, позволяющая запускать RTX Voice на Windows 7 и, что интереснее всего, на отличных от семейства RTX графических ускорителях. Поэтому неудивительно, что NVIDIA в конце концов сама подправила RTX Voice для поддержки видеокарт GTX.

Владельцы старых карт GeForce GTX могут загрузить утилиту RTX Voice с официального сайта. Но тем, у кого в распоряжении имеется ускоритель RTX 20-й серии или RTX-30-й серии, лучше загрузить уже более совершенное ПО — RTX Broadcast, которое включает в себя и RTX Voice, и функцию веб-камеры с интеллектуальной заменой фона.

Стоит напоследок отметить, что и в RTX Voice, и в RTX Broadcast шумоподавление работает на удивление хорошо — ИИ отлично справляется с удалением фонового шума, не уничтожая и не приглушая при этом голос.

«Яндекс» рассказала, как её робомобили справились с суровыми условиями московской зимы

С момента первого появления на дорогах в 2017 году беспилотные автомобили «Яндекса» проехали уже больше 10 миллионов километров, преимущественно по Москве. Компания отметила, что условия в столице — одни из самых сложных: это и загруженные дороги мегаполиса, и причудливая сеть улиц и переулков, и разнообразная погода. Компания поделилась опытом, приобретённым зимой 2020/21 года.

По словам «Яндекса», в этом году зима в столице отличалась обильными снегопадами, причём 13 февраля был поставлен рекорд по осадкам за всю историю наблюдений. Несмотря на это, робомобили продолжали колесить по улицам в любых погодных условиях. Зимой у автоматики появляется целый ряд дополнительных трудностей, которые необходимо преодолевать.

Прежде всего, это плохая видимость во время снегопада. Когда идёт снег, часть лучей лидаров (это более миллиона в секунду) отражается от снежинок и создаёт шум. Специалисты компании разработали особую нейронную сеть, способную нивелировать эту побочную информацию. Работает она довольно эффективно (до и после фильтрации):

Также при минусовых температурах проблемы для автоматики может создавать пар, идущий из выхлопных труб автомобилей, вентиляционных шахт и ливнёвок. Он бывает настолько густым, что на лидарном облаке может выглядеть как физическое препятствие. Нейронные сети тоже должны уверенно отличать завесу пара от настоящих объектов. За счёт нескольких миллионов километров пробега робомобилей зимой ИИ получает необходимые для обучения знания, чтобы оценивать по картинке с камеры реальную ситуацию на дороге. Вот как выглядит лидарное облако до и после фильтрации:

Стоит отметить, что за счёт лидаров система смогла распознать скрытого за паром пешехода, несмотря на плотный пар. Даже водителю-человеку было бы сложно справиться с этой задачей в таких условиях:

Кроме того, автоматика должна распознавать параметры дорожного покрытия: снег может быть свежим и рыхлым или жёстким и слежавшимся. Порой он выглядит безобидно, но на деле под ним скрывается лёд, причём самые разные варианты могут встретиться в течение одной поездки. Робомобилям нужно уметь адаптироваться под разное покрытие, и потому автопилот «Яндекса» обучен определять коэффициент трения и учитывать его при планировании действий на дороге. Вот лишь одна из поездок по Москве в сильный снегопад:

Стоит сказать, что робомобили «Яндекса» движутся по улицам, опираясь не только на данные камер и лидаров, но и на загруженные заранее трёхмерные карты местности, которые постоянно сопоставляются с данными лидара и позволяют с точностью до сантиметра определять своё местоположение. Сильный снегопад способен изменить город до неузнаваемости: дорожная разметка может быть скрыта, границы проезжей части — незаметны, а во время уборки снега могут вырасти сугробы высотой с двухэтажный дом.

Автопилот сохраняет способность ориентироваться в пространстве даже в таких условиях. Система использует данные и лидарного облака, и показания инерциальных измерителей (IMU), и одометрии. Сопоставляя информацию, автоматика с высокой точностью устанавливает, где находится машина даже в сложных ситуациях — например, когда проскальзывают колёса и срабатывает ABS. Также робомобиль умеет автоматически обновлять 3D-карту. Если на пустом месте появился огромный сугроб, система «увидит» его, и сугроб станет одним из объектов карты. Вот как выглядит одна и та же улица в обычное время и после обильных снегопадов (цветом показана высота, красный — выше 3 м):

Это лишь часть трудностей, с которыми сталкиваются робомобили зимой. Например, в холодное время года в городе больше дорожной техники; из-за сугробов проезжая часть становится уже; мест для парковки меньше, и многие паркуются вторым рядом; чаще возникают пробки, и самые нетерпеливые участники движения пытаются объехать их по встречной полосе; пешеходы торопятся скорее попасть в тёплый дом или офис и срезают путь.

Intel продолжает второй сезон бесплатных вебинаров CV Academy для опытных разработчиков

Компания Intel продолжает второй сезон проекта CV Academy для опытных разработчиков — вебинары по компьютерному зрению, глубокому обучению и оптимизации.

17 марта 19:00 – 20:30 — Применение компьютерного зрения в медицине

Регистрация: https://jsc-intel.timepad.ru/event/1446273

На вебинаре Вы узнаете о современных подходах к решению вычислительно трудоемких задач в области медицины (хирургия, гистология, исследование ДНК) и биохимии.

Спикером выступит Дмитрий Куртаев, инженер по разработке ПО, Intel, нейросетевой хирург, IOTG Russia.

24 марта 19:00 – 20:30 — Компиляторы для нейронных сетей

Регистрация: https://jsc-intel.timepad.ru/event/1446273

Будут рассмотрены существующие компиляторы, их плюсы и минусы, особенности и концепции. Будут описаны основные программные методы, которые используются для выбора оптимального способа исполнения алгоритма на устройстве из всех возможных. Также Вы узнаете о перспективах развития данной области.

Спикер — Александр Новак, разработчик из команды Neural Network Compilers, Intel, IOTG Russia.

14 апреля 19:00 – 20:30 — Оптимизация нейронных сетей

Регистрация: https://jsc-intel.timepad.ru/event/1446273

На вебинаре будут рассмотрены актуальные методы, позволяющие ускорить вычисление нейронных сетей. Особое внимание будет уделено методам квантизации нейросетей как наиболее эффективным с точки зрения критерия “точность – ускорение”. Вы узнаете, как сделать мир интеллектуального Интернета вещей еще умнее.

Спикер — Александр Козлов, инженер по глубокому обучению, Intel, IOTG Russia.

Регистрация на вебинары CV Academy обязательна и позволяет:

  • Узнать о новейших трендах в AI / Deep Learning от экспертов мирового уровня
  • Принять участие в живой Q&A сессии с ведущими разработчиками Intel
  • Получить эксклюзивный доступ к видеозаписям вебинаров

Все вебинары в рамках CV Academy, на которые открыта регистрация:

  • 17 марта — Применение компьютерного зрения в медицине
  • 24 марта — Компиляторы для нейронных сетей
  • 31 марта — OpenCV для встраиваемых платформ
  • 7 апреля — Введение в OpenCV G-API, современный API в области компьютерного зрения
  • 14 апреля — Оптимизация нейронных сетей
  • 21 апреля — Оптимизация производительности
  • 28 апреля — Concept-Based polymorphism в С++
window-new
Soft
Hard
Тренды 🔥