Сегодня 07 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В Tinkoff Research придумали, как ускорить обучение искусственного интеллекта в 20 раз

Учёные из лаборатории исследований искусственного интеллекта Tinkoff Research разработали SAC-RND — новый алгоритм для обучения ИИ. На робототехнических симуляторах было достигнуто повышение скорости обучения в 20 раз по сравнению со всеми существующими аналогами при возросшем на 10 % качестве. Оптимизация крайне ресурсоёмкого процесса обучения ИИ ускорит развитие многих сфер, где применяется ИИ.

 Источник изображения: Tinkoff

Источник изображения: Tinkoff

Разработчики утверждают, что SAC-RND может «повысить безопасность беспилотных автомобилей, упростить логистические цепочки, ускорить доставку и работу складов, оптимизировать процессы горения на энергетических объектах и сократить выбросы вредных веществ в окружающую среду. Открытие не только улучшает работу узкоспециализированных роботов, но и приближает нас к созданию универсального робота, способного в одиночку выполнять любые задачи».

Результаты исследования были представлены в конце июня на 40-й Международной конференции по машинному обучению (ICML) в Гонолулу, Гавайи. Эта конференция является одной из трёх крупнейших в мире в сфере машинного обучения и искусственного интеллекта.

Одним из наиболее перспективных видов обучения ИИ является обучение с подкреплением (RL), позволяющее ИИ учиться методом проб и ошибок, адаптироваться в сложных средах и изменять поведение на ходу. Обучение с подкреплением может использоваться во всех сферах: от регулирования пробок на дорогах до рекомендаций в социальных сетях.

При этом ранее считалось, что использование случайных нейросетей (RND) не применимо для офлайн-обучения с подкреплением. В методе RND используются две нейросети — случайная и основная, которая пытается предсказать поведение первой. Свойство нейросети определяются её глубиной — количеством слоёв, из которых она состоит. Основная сеть должна содержать больше слоёв, чем случайная, иначе моделирование и обучение становится нестабильным или даже невозможным.

Использование неправильных размеров сетей привело к ошибочному выводу, что метод RND не умеет дискриминировать данные — отличать действия из датасета от прочих. Исследователи из Tinkoff Research обнаружили, что при использовании эквивалентной глубины сетей, метод RND начинает качественно различать данные. Затем исследователи приступили к оптимизации ввода и научили роботов приходить к эффективным решениям при помощи механизма слияния, основанного на модуляции сигналов и их линейном отображении. До этого при использовании метода RND поступающие сигналы не подвергались дополнительной обработке.

На визуализации ниже в верхнем ряду показаны предыдущие попытки применения метода RND, в нижнем — метод SAC-RND. Стрелки на изображении должны вести робота в одну точку — они указывают направление к правильному действию. Метод Tinkoff Research во всех случаях стабильно приводит робота в нужную точку

 Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Источник изображения: Tinkoff Research

Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Источник изображения: Tinkoff Research

Метод SAC-RND был протестирован на робототехнических симуляторах и показал лучшие результаты при меньшем количестве потребляемых ресурсов и времени. Открытие поможет ускорить исследования в области робототехники и обучения с подкреплением, поскольку оно снижает время получения устойчивого результата в 20 раз и является важным шагом на пути к созданию универсального робота.

Tinkoff Research — российская исследовательская некоммерческая группа. Учёные из Tinkoff Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV), обучение с подкреплением (RL) и рекомендательные системы (RecSys). Команда курирует исследовательскую лабораторию «Тинькофф» на базе МФТИ и помогает талантливым студентам совершать научные открытия.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Парижский суд впервые допросил основателя Telegram Павла Дурова по существу предъявленных обвинений 6 ч.
Ubisoft пытается договориться с акционерами о выкупе компании — основатели боятся потерять контроль, а Tencent хочет больше власти 6 ч.
Новая статья: [REDACTED] — в тюрьме как в Тартаре. Рецензия 6 ч.
Бывший аниматор Rockstar объяснил, почему студия тянет со вторым трейлером GTA VI 7 ч.
Депутат Горелкин заявил, что запрещать продажу техники Apple в России не будут 7 ч.
Студия экс-режиссёра Dragon Age подтвердила дату выхода и системные требования Eternal Strands — фэнтезийного боевика с физикой нового поколения 8 ч.
В Steam и на консолях без предупреждения вышел хоррор-шутер The Thing: Remastered по фильму «Нечто» — игроки в восторге от ремастера 9 ч.
Надёжный инсайдер рассекретил дату выхода Split Fiction — следующей игры от создателей It Takes Two и A Way Out 10 ч.
«Гвинт» из The Witcher 3: Wild Hunt скоро станет настоящей настольной игрой — первые подробности 11 ч.
«Группа Астра» купила «Платформу Боцман» — отечественного разработчика ПО для контейнеризации 16 ч.
ИИ даёт плоды: HPE впервые завершила квартал с рекордной выручкой в $8,5 млрд и вдвое выросшей прибылью 4 ч.
Новый гигантский ИИ-кампус Meta похож на процессор, и это не случайность 4 ч.
Asus представила смарт-монитор ZenScreen Smart MS32UC, сверхтонкий ZenScreen MB27ACF и портативный ZenScreen MB166CK 7 ч.
Asus представила 4K-мониторы ProArt Display PA32UCE и PA27UCGE для профессионалов с автоматической естественной цветопередачи 7 ч.
Запущена Cobra — линия, которая приблизила массовый выпуск передовых твердотельных аккумуляторов QuantumScape 8 ч.
«РТК-ЦОД» запустил облачный сервис видеоконференцсвязи на базе отечественного ПО MINT 8 ч.
Открыт сезон подарков от сервисных центров HUAWEI 8 ч.
«Хаббл» впервые разглядел окрестности квазара и засёк там «капли» и огромную струю 11 ч.
Производство чипов Samsung увязло в кризисе: выручка обвалилась, хотя у всех конкурентов подскочила 12 ч.
xAI получил ещё $6 млрд инвестиций и приступил к расширению ИИ-кластера Colossus до 1 млн ускорителей 13 ч.