Теги → машинное обучение
Быстрый переход

Apple купила канадский стартап Inductiv для дальнейшего совершенствования Siri

Apple купила Inductiv Inc., канадский стартап в области машинного обучения, с целью дальнейшего совершенствования голосового помощника Siri, а также технологий искусственного интеллекта и Data Science, сообщил редактор Bloomberg Марк Гурман (Mark Gurman).

«В последние недели команда инженеров из Inductiv (Ватерлоо, провинция Онтарио) присоединилась к Apple, чтобы заняться Siri, машинным обучением и Data Science. Apple подтвердила сделку, заявив, что „время от времени покупает небольшие технологические компании и обычно не обсуждает свои цели или планы“», — сообщил Гурман.

Помимо профилей сотрудников в LinkedIn, у стартапа нет присутствия в Интернете, но, согласно публикации, им разработана технология, которая использует ИИ для выявления и исправления ошибок в данных, что важно для машинного обучения и относится к области Data Science.

Ранее Apple наняла специалистов в этой области, в том числе ряд инженеров из консалтинговой компании Silicon Valley Data Science в 2018 году. Предполагается, что Apple продолжает модернизацию технологии, используемой в Siri, других продуктах и сервисах с поддержкой ИИ.

Как отмечает Гурман, в последние годы Apple приобрела целый ряд компаний, занимающихся ИИ и данными, в том числе Tuplejump, Laserlike, Turi и Perceptio. Только в этом году компания купила Voysis для улучшения распознавания речи интеллектуальным ассистентом Siri, стартап в сфере виртуальной реальности NextVR и разработчика популярного погодного приложения Dark Sky.

Японский Мойдодыр: Fujitsu создала ИИ для контроля над мытьём рук на рабочем месте

Удивительно, но до эпидемии коронавируса многие даже не подозревали о важности мытья рук. Это тем более недопустимо на рабочих местах, связанных с обслуживанием людей: в больницах, школах, общепите и так далее. Компания Fujitsu предложила автоматизировать контроль над этой процедурой, для чего разработала ИИ со своей моделью обучения.

Кадр из м/ф Мойдодыр

Кадр из м/ф Мойдодыр

В соответствии с новыми правилами обеспечения гигиены на рабочих местах, которые в Японии вступят в силу в июне этого года, меры по выполнению гигиенических требований (в частности, по процедуре мытья рук) и по контролю над их исполнением будут значительно усилены. Это будет означать, что каждое мытьё рук будет вестись под наблюдением ответственного лица.

Министерство здравоохранения, труда и социального обеспечения Японии рекомендует людям выполнять 6 шагов, чтобы обеспечить правильное мытье рук и предотвращение пищевых отравлений, а также распространение инфекционных заболеваний (см. картинку ниже). Сегодня работники ведут журнал мытья рук с отметкой о выполненных шагах по этой процедуре. Регламентируется порядок мытья и количество повторов на каждом шаге. За этими действиями должен наблюдать инспектор, что увеличивает производственные затраты. Именно эту работу Fujitsu предлагает перевалить на плечи ИИ.

Компания доработала фирменный алгоритм Actlyzer по поведенческому анализу, чтобы на основе сравнительно небольшой выборки создать модель для отслеживания как всех предложенных Министерством шести шагов по мытью рук, так и для подсчёта количества рекомендованных действий на каждом этапе для каждой руки (сколько раз, что и как тереть). Сложность создания такой модели заключалась в том, что ключевые точки для обычного распознавания жестов ― костяшки и фаланги пальцев ― при мытье рук переплетаются и маскируются пеной моющего средства.

Рекомендазии МОЗ Японии по правильному мытью рук

Рекомендации МОЗ Японии по правильному мытью рук

Как сообщают в компании, задача по распознаванию движений ладоней и пальцев была успешно решена, когда за базу было взято распознавание формы и положения обеих рук. Исследователи сделали переход от общего к частному. Заявленная точность распознавания каждого из шести рекомендованных при мытье рук шагов превысила 95 %, а точность подсчёт повторов действий на каждом этапе оказалась не хуже 90 %. Вероятно, где-то перед лицом занимающегося водными процедурами человека будет загораться зелёный светодиод, если он, по мнению ИИ, правильно выполнит все процедуры или душевая кабинка останется заблокированной. Мы думали, что ИИ поможет нам с прорывом в науке, а вышло так, что ему придётся учить взрослых людей базовым навыкам детского сада.

Facebook разработала искусственный интеллект для создания объемных фотографий

Группа исследователей искусственного интеллекта Facebook совместно с американскими и тайваньскими учёными разработала новый метод создания 3D-фотографий. Подобные алгоритмы для придания изображениям объёмного вида уже существуют, но выдаваемые ими результаты портятся артефактами в виде размытия и других искажений. Основанная на машинном обучении технология устраняет практически все эти минусы.

Новая нейронная сеть способна придавать объем двум видам изображений. Во-первых, она поддерживает фотографии формата RGB-D, которые можно снять при помощи двойной камеры iPhone, контроллера Kinect и других устройств с возможностью определения глубины сцены. Во-вторых, она может работать и с обычными 2D-изображениями — главное, предварительно задать параметры глубины.

Способности нейросети были продемонстрированы на примере случайно отобранных фотографий из набора RealEstate10K. Для демонстрации качества обработки 2D-фотографий, были взяты исторические кадры XX века.

Благодаря внедрению технологии Inpainting, разработчики смогли удалить артефакты, которые возникали при создании трёхмерных изображений другими методами. В ходе этого процесса искусственный интеллект обнаруживает недостающие пиксели и воссоздаёт их — как результат, на объёмных фотографиях нет размытия и искажений.

Подробнее о работе новой нейронной сети написано в статье, опубликованной на сервере arXiv. Разработанная технология предъявляет меньше требований к исходным изображениям, чем все остальные. Возможно, в будущем она станет ещё лучше и будет использоваться в виртуальной реальности.

Одной из самых известных технологий подобного рода является Facebook 3D Photos. Она тоже может придать объем любой фотографии — подробнее о ней можно почитать в этом материале.

Facebook научил свой ИИ распознавать товары на фотографиях в соцсети, чтобы вы могли их купить

Компания Facebook сегодня запустила «универсальную модель распознавания продуктов», которая использует искусственный интеллект (ИИ) для идентификации широкого спектра потребительских товаров: от мебели и одежды до дорогих автомобилей. Это первый шаг к будущему, когда предметы на каждом изображении на сайте соцсети можно будет сначала идентифицировать, а потом купить.

«Мы хотим, чтобы всё и вся на нашей платформе было доступно для покупки, когда этого захочется» — сказал Манохар Палури (Manohar Paluri), руководитель отдела прикладного компьютерного зрения в Facebook. Возможность распознавания товаров — первое новшество на базе ИИ в серии обновлений для платформы электронной коммерции Facebook в ближайшем будущем. В конечном итоге в соцсети объединятся искусственный интеллект, дополненная реальность и даже цифровые помощники, что можно будет выразить термином «социальный» шопинг. Facebook и Instagram также запустили сегодня платформу под названием Shops, которая позволяет малому бизнесу создавать бесплатные витрины для своих магазинов в Facebook и Instagram.

Facebook не стала первой на поприще интернет-торговли с задействованием средств ИИ. Например, Amazon уже создала своего собственного помощника на базе ИИ области одежды/моды, правда теперь о нем мало что слышно. А использование машинного зрения для идентификации и покупки товаров стало реальностью ещё, по крайней мере, со времен Amazon Fire Phone. Тем не менее, онлайн-торговые платформы, такие как eBay, уже используют искусственный интеллект для ускорения работы листинга товаров на продажу, а Amazon — одна из многих фирм, которая запустила свой собственный «Shazam для одежды» с применением технологии машинного обучения.

Компания Facebook заверяет, что её собственные инструменты отличаются от разработок конкурентов своим охватом и точностью. Новый инструмент распознавания товаров, который называется GrokNet, может идентифицировать десятки тысяч различных атрибутов на изображении: начиная от цвета и размера предметов, и заканчивая определением конкретных брендов.

ИИ GrokNet уже был развернут на Facebook Marketplace, где он помогает пользователям быстро определять товары для продажи, и генерирует короткие описания. Например, можно загрузить в соцсеть фотографию своего дивана, и онлайн-платформа предложит назвать его для продажи как «черный, кожаный, секционный диван».

В разработке этих инструментов компании Facebook, конечно, помогает прямой доступ к фотографиям пользователей на Marketplace. GrokNet обучается на колоссальной базе данных порядка 100 миллионов изображений. Facebook говорит, что эти данные жизненно важны для создания системы машинного зрения, которая сможет идентифицировать товары на фотографиях при плохом освещении и с сомнительных ракурсов.

Достоверно не известно, насколько точно работает GrokNet. Компания заверяет, что ИИ может идентифицировать 90 процентов изображений в Marketplace, в категории «Дом и сад». Однако Facebook не разглашает аналогичной статистики для других категорий продуктов.

Google разработала наушники с сенсорным проводом для управления музыкой

Исследователи из Google Research разработали «умный» провод I/O braid, который распознает прикосновения пользователей. Он способен улавливать сдавливание, скручивание и простые касания любого человека. Ощущая разные типы прикосновений, используемый в наушниках провод даёт смартфону команды на увеличение и уменьшение громкости, переключение трека и выполнение других действий. Принцип работы I/O braid показан на видео ниже.

Провод распознает прикосновения благодаря состоящему из сенсорных проводов сплетению, именуемому как «спиральная сенсорная матрица». Оплётка покрывает всю поверхность шнурка, поэтому пользователь может управлять музыкой, касаясь любой области.

Способность различать разные типы касаний была реализована при помощи машинного обучения. Данные для обучения были собраны при помощи добровольцев, которых попросили различными способами взаимодействовать с проводом. В конечном итоге, благодаря собранным данным, I/O braid научился с 94% точностью распознавать скручивания, сдавливания и другие виды деформации.

Исследователи придумали жесты для управления музыкой на смартфоне:

  • одинарное нажатие — начало воспроизведения и пауза;
  • двойное нажатие — переход к следующему треку;
  • скручивание влево — уменьшение громкости;
  • скручивание вправо — увеличение громкости.

По мнению изобретателей, скручивать и сжимать провод наушников гораздо проще, чем нажимать на клавиши управления на наушниках. Однако, у такого способа управления есть большой минус — во время ходьбы провод деформируется сам по себе, из-за чего возникают ложные срабатывания.

Как бы то ни было, на данный момент I/O braid — это всего лишь исследовательский проект, и серийные наушники с «умными» проводами вряд ли поступят в продажу в ближайшее время.

Платформа NVIDIA Isaac Sim 2020.1 ускорит разработку и симуляцию роботов

Во время заочного доклада #GTC20 исполнительный директор и основатель NVIDIA Дженсен Хуанг (Jensen Huang) продемонстрировал первую в отрасли платформу для разработки искусственного интеллекта роботов с симуляцией, навигацией и манипуляциями.

На представленном видео показано, как модель робота NVIDIA Kaya толкает жёсткие тела и мягкие пляжные мячи, модель манипулятора управляется с корзинами, лотками и другими предметами и наконец логистический робот #robot занимается транспортировкой поддона с грузом, учитывая внешние препятствия и движения аналогичных роботов. Симуляции автоматизированных действий, произведённые в Isaac SIM 2020.1, затем с тем же успехом выполняются в реальных условиях.

Графические процессоры ускоряют машинное обучение, восприятие и планирование с использованием глубинных нейронных сетей. Моделирование процессов позволяет ускорить разработку, обучение и тестирование алгоритмов роботов.

Isaac SDK включает каркас приложений Isaac Engine, пакеты с высокопроизводительными робототехническими алгоритмами Isaac GEM, эталонные приложения Isaac Apps и мощную платформу моделирования Isaac Sim for Navigation. Эти инструменты и интерфейсы API ускоряют разработку роботов, упрощая внедрение искусственного интеллекта для восприятия пространства и навигации.

Набор инструментов разработчиков оптимизирован для систем NVIDIA Jetson AGX Xavier, представленных в декабре 2018 года и обеспечивающих хорошее сочетание производительности и энергоэффективности автономных машин. JetPack SDK включает в себя NVIDIA CUDA, DeepStream SDK, библиотеки для глубинного обучения, компьютерного зрения, ускоренных вычислений и мультимедиа.

Isaac SDK использует рабочие процессы машинного обучения и непрерывного тестирования при исполнении Isaac Sim на системах NVIDIA DGX, разработанных под требования ИИ и аналитики. Эти полностью интегрированные решения предназначены, чтобы предоставить учёным, работающим с данными, самые мощные инструменты для ИИ и машинного обучения.

Набор инструментов разработчиков и платформа Isaac SIM 2020.1 станут доступны позже в этом месяце.

Холодильники начнут узнавать нас в лицо: Sony предлагает датчики изображений с ИИ

Лидер производства датчиков изображений компания Sony предчувствует насыщение этой продукцией главного потребителя ― рынка смартфонов. Компании нужны новые направления для сбыта датчиков. Этим направлением может стать рынок умных вещей с функциями эффективного отслеживания людей и объектов.

По мнению Sony, развитие сферы Интернета вещей упирается в ряд ограничений: это высокие задержки при обращении к облаку (которые только будут расти); предпосылки для нарушения приватности (плохо контролируемый рост утечек из облака); и увеличение энергопотребления (на канал связи и удалённые ресурсы). Всего этого можно избежать или значительно ослабить влияние этих факторов, если в каждый датчик изображения встроить свой ИИ. Тогда данные будут обрабатываться в режиме реального времени прямо в датчике без обращения к облаку.

Первой продукцией Sony в области датчиков изображений с ИИ стал 12,3-Мп сенсор IMX500, опытные поставки которого начались в апреле. Цена вопроса 10 тыс. иен ($93). Это стоимость сборки без упаковки. В корпусе чип будет предлагаться в виде микросхемы IMX501 по 20 тыс. иен ($186). Разницу между одним и другим исполнением можно увидеть на фото выше.

IMX500 состоит из собранных в стек двух кристаллов. Верхний кристалл ― это датчик изображения диагональю 7,857 мм (в формате 1/1,23), а нижний ― это чип с памятью, блоком ИИ и цифровым сигнальным процессором. Данные с датчика изображения попиксельно передаются на нижний чип и полностью на нём обрабатываются.

Сценарии использования датчиков изображдения с ИИ

Сценарии использования датчиков изображения с ИИ

Обработка ведётся в зависимости от записанной в память чипа модели для машинного обучения, а также по заранее определённому алгоритму. Это может быть подсчёт количества людей в кадре, определение поведения людей в кадре (анализ поз и жестов), анализ скопления людей с помощью инфракрасного сканирования, слежение за товарами на полках магазинов, определение момента засыпания водителя, реакция на конкретного человека и многое другое.

Модели обучения и алгоритмы могут быть переписаны по необходимости. Например, можно распределять обязанности даже между одинаковыми камерами наблюдения. Одна на входе подсчитывает посетителей, другая наблюдает за тем, что граждане делают в магазине, третья следит, чтобы на полках всегда был товар и так далее. Что во всём этом важно, данные остаются локально в датчике, а это обеспечивает приватность и защиту от утечек. Наружу для анализа выводятся метаданные ― короткие текстовые (семантические) сообщения с выводами или графиками после анализа встроенным ИИ. Эти данные не перегрузят каналы связи и не нагрузят облачные ресурсы. Впрочем, датчик позволяет также передавать обычные изображения и распознанные образы.

Обработка данных в кадре встроенным ИИ проводится мгновенно. Например, с использованием свёрточной нейросети MobileNet V1.2 данные в кадре обрабатываются за 3,1 мс. Предложенная Sony система способна с высокой эффективностью следить за подвижными объектами в режиме реального времени. Вот оно будущее.

Intel Capital инвестирует $132 млн в 11 прорывных технологических стартапов

Intel Capital, глобальная инвестиционная организация в составе корпорации Intel, объявила о новых инвестициях на общую сумму $132 млн в 11 технологических стартапов. Все они выводят на рынок прорывные инновации в области искусственного интеллекта (ИИ), автономных вычислений и проектирования микросхем.

«Intel Capital выявляет и инвестирует в прорывные стартапы, которые трудятся над улучшением нашей работы и жизни. Каждая из наших недавних инвестиций расширяет границы в таких областях как искусственный интеллект, анализ данных, автономные системы и инновации в полупроводниках. Intel Capital очень рада работать с этими компаниями, поскольку мы совместно ориентируемся на текущие мировые вызовы и вместе движемся к устойчивому и долгосрочному росту»,  ― заявил Уэнделл Брукс (Wendell Brooks), старший вице-президент Intel и президент Intel Capital.

Вот новые стартапы, в которые инвестировала Intel Capital:

  • Anodot (Редвуд-Сити, Калифорния) приближает будущее бизнес-аналитики путём внедрения проприетарных алгоритмов машинного обучения. Около 500 компаний в телекоммуникационном, финансовом и цифровом секторах полагаются на ПО автономного бизнес-мониторинга в режиме реального времени для отслеживания инцидентов, влияющих на доходы/расходы организации.
  • Astera Labs (Санта-Клара, Калифорния) специализируется на разработке интерфейсных решений для дата-центров, устраняющих узкие места в производительности при интенсивных вычислительных нагрузках, таких как работа искусственного интеллекта и машинное обучение. Ассортимент продукции компании включает в себя системные полупроводниковые интегральные схемы, платы и системы, обеспечивающие надежное подключение к решениям PCI Express (PCIe) и Compute Express Link (CXL).
  • Axonne (Саннивейл, Калифорния) разрабатывает решения для подключения к высокоскоростным сетям Ethernet следующего поколения для автомобилей. Решения Axonne помогают интегрировать современные системы в авто, такие как автономные датчики движения и дисплеи с вычислительными кластерами. Запатентованные компанией схемы и алгоритмы обработки сигналов внедряются в ПО автономного вождения.
  • Hypersonix (Сан-Хосе, Калифорния) ― автономная аналитическая платформа на базе искусственного интеллекта, предназначенная для предприятий розничной торговли, ресторанов, гостиничного бизнеса и отрасли электронной коммерции. Сервис позволяет клиентам принимать более быстрые и разумные решения, которые способствуют повышению прибыльности, росту производительности и привлечению новых клиентов с помощью простого голосового и текстового поиска, визуализации и интерпретации данных.
  • KFBIO (Чжэцзян, Китай) ― биотехнологическая компания, которая строит цифровые патологические системы. Медицинская обработка изображений KFBIO использует большие данные, облачные вычисления и искусственный интеллект для быстрого и надежного сканирования и оцифровки изображений, что облегчает их передачу для удаленной консультации с экспертами, а также повышает скорость и точность диагностики с помощью искусственного интеллекта.
  • Lilt (Сан-Франциско) стремится сделать всю информацию доступной для всех с помощью программного обеспечения на основе искусственного интеллекта по переводу языков. Программное обеспечение Lilt обеспечивает точный, локализованный и недорогой перевод, сочетая адаптивную технологию нейронного машинного перевода, систему управления переводами и профессиональных переводчиков.
  • MemVerge (Милпитас, Калифорния) ― компания, основанная на концепции, что каждое приложение должно работать в памяти (как бы странно это не звучало). Программное обеспечение MemVerge Memory Machine является основой для новой эры вычислений с использованием больших объёмов оперативной памяти, предоставляя пулы общей постоянной памяти размером в петабайт и мощные службы обработки данных. Это востребовано приложениями на основе искусственного интеллекта и машинного обучения, ПО для анализа данных финансового рынка и другими высокопроизводительными вычислениями.
  • ProPlus Electronics (Шаньдун, Китай) ― компания по автоматизации электронного проектирования (EDA), специализирующаяся на передовом моделировании устройств и быстрых решениях для моделирования схем. ProPlus помогает сократить разрыв между проектированием и производством с помощью своего программного обеспечения, которое ускоряет разработку микросхем и повышает скорость изготовления устройств, позволяя полупроводниковой промышленности создавать более мощные и разнообразные продукты.
  • Компания Retrace (Сан-Франциско) считает, что более рациональное и инновационное использование стоматологических данных имеет важное значение для борьбы с заболеваниями полости рта. Retrace применяет искусственный интеллект и другие передовые технологии в своей платформе прогнозной аналитики, которая использует данные в реальном времени для улучшения принятия стоматологических решений.
  • Spectrum Materials (Фуцзянь, Китай) ― поставщик специализированного газа и материалов для полупроводниковых фабрик. Имеет одну из самых больших баз по производству германия в Цюаньчжоу, Фуцзянь. Во главе с опытными отраслевыми экспертами Spectrum Materials занимается предоставлением критически важных специализированных газов и материалов для передовых узлов нескольких ведущих фабрик по всему миру.
  • Xsight Labs (Кирьят-Гат, Израиль) разрабатывает инновационные технологии для развития облачных, интенсивных рабочих нагрузок следующего поколения, таких как машинное обучение, анализ данных и дезагрегированное хранение. Xsight предлагает новые конструкции чипсетов, которые повышают масштабируемость, производительность и эффективность работы вычислительных систем.

Нейросеть научилась превращать портреты людей в фотографии животных

Бельгийский программист Ксандер Стинбрюгге (Xander Steenbrugge) разработал нейросеть «Humanimals», которая превращает людей на фото в животных. Новый эксперимент исследователя стал частью его крупного проекта «Neural Synesthesia», в рамках которого он создаёт произведения искусства совместно с искусственным интеллектом.

В рамках нового эксперимента программист совместил две нейронные сети, выложенные в открытый доступ. Первая генеративная модель называется StarGAN v2, основана на 15 тысячах HD-изображениях животных и способна превращать одних зверей в других. Вторая модель известна как StyleGAN v2 и плавно придаёт лицу одного человека очертания другого лица.

Обе нейронные сети являются генеративно-состязательными и состоят из двух частей. Первая генерирует образцы, а вторая отфильтровывает те, которые не соответствуют заданным требованиям и пропускает «правильные». Обычно генеративно-состязательные нейросети используются для создания портретов и улучшения качества фотографий.

«В большинстве научных работ нейронная сеть имеет одну намеченную цель «А». Но поскольку методы машинного обучения очень гибки, на самом деле он может достигать целей «B», «C» и «D» с одной и той же моделью, но с разными алгоритмами. Вот тут-то и начинается настоящее веселье»,объяснил Ксандер Стинбрюгге журналистам издания Motherboard.

Практического применения новой нейронной сети нет, но она в очередной раз доказывает, что компьютеры тоже могут заниматься творчеством. В рамках проекта «Neural Synesthesia» Ксандер уже создавал произведения искусства. Например, ранее он научил нейронную сеть создавать плавные переходы между картинами и скрестил полученный результат с музыкой. Результат работы можно посмотреть на видео ниже.

Разработкой подобных нейронных сетей занимаются в России. В 2019 году сотрудники Центра искусственного интеллекта Samsung создали модель, которая буквально «оживляет» портреты известных людей. Посмотреть, как бы выглядел говорящий Ф. М. Достоевский, можно здесь.

От рока до хип-хопа: искусственный интеллект OpenAI научился создавать музыку с вокалом

Исследовательская компания OpenAI представила Jukebox — искусственный интеллект, сочиняющий музыку с осмысленными текстами и вокалом. Зарубежные журналисты сообщают, что это самый впечатляющий ИИ для написания музыки, который они видели.

Система Jukebox обучалась на основе множества отрывков из песен самых разных жанров, от классического рока до хип-хопа. Подобно тому, как другие нейронные сети способны имитировать стили рисования знаменитых художников, новый проект OpenAI может создавать музыкальные композиции как у исполнителей, на треках которых он обучался. Например, он может сочинить музыку в стиле кантри-певца Джонни Кэша, рэпера Drake и даже российской поп-группы «Тату».

«Мы показываем, что наши модели искусственного интеллекта могут создавать песни на основе самых разных музыкальных жанров, таких как рок, хип-хоп и джаз. Они могут создать мелодию, ритм и тембры для самых разных инструментов, а также стили и голоса певцов, которые будут звучать вместе с музыкой», — объяснили представители OpenAI.

Компания обучает искусственный интеллект сочинению музыки далеко не первый год. Ранее она уже демонстрировала возможности системы MuseNet, которая самостоятельно сочиняла полноценные MIDI-композиции. Но искусственный интеллект, способный создавать песни разных жанров с вокальными партиями, это для неё что-то новое.

На данный момент музыка OpenAI впечатляет, но далека по качеству от идеала. Искусственному интеллекту пока явно не хватает мастерства, чтобы воссоздать полную структуру музыки с куплетами и повторяющимися припевами.

На создание одной минуты музыкального трека искусственному интеллекту Jukebox требуется около 9 часов. Так что компания пока не может создать приложение, где музыкальные композиции сможет создавать каждый. Зато разработчики опубликовали результаты работы Jukebox. Послушать их можно на специальном сайте.

Новая статья: Как обучить модель за меньшие деньги? Сравниваем стоимость тренировки модели на разных GPU-платформах

Данные берутся из публикации Как обучить модель за меньшие деньги? Сравниваем стоимость тренировки модели на разных GPU-платформах

Google Project Chimera позволит маленьким командам создавать большие игры

Машинное обучение используется в самых разных сферах информационных технологий, и естественно задаться вопросом, как его можно применить для расширения возможностей разработки игр. Это именно то, что исследует Google с помощью своего проекта Chimera. Команда инженеров и разработчиков изучает потенциальные возможности применения генеративно-состязательной нейронной сети (GAN).

Общаясь с изданием MCVUK, руководитель творческого отдела исследований и разработок Google Stadia Эрин Хоффман-Джон (Erin Hoffman-John) объяснила, что машинное обучение может позволить даже небольшим командам создавать игры размером с World of Warcraft.

«Мы берём на себя риск, который не хотят брать разработчики. Мы говорили с внешними разработчиками и спрашивали их — что они всегда хотели сделать, но не смогли? Какие вещи им пришлось вырезать из своих игр, потому что не удалось сделать их достаточно быстро или просто не было вычислительной мощности, — сказала Хоффман-Джон. — Что, если команда из 14 человек сможет сделать игру масштабом с World of Warcraft? Это абсурдная цель, правда? В таких играх, как WoW, заложено много тяжёлого повторного создания контента. Художники и сценаристы делают много, по сути, дублирующих работ — вот куда вкладываются большие инвестиции. Если вы посмотрите на сумму, потраченную на создание такой игры, как World Warcraft, это примерно 70 % контента и 30 % кода или меньше. Даже несмотря на то, что это огромное количество кода, контента сильно больше».

Project Chimera также призван упростить балансирование игр.

«Миллионы игровых сессий нейросетевых агентов, обученных правилам игры, позволят нам очень быстро протестировать баланс, — сказала Хоффман-Джон. — Таким образом, даже небольшая студия-разработчик, которая может не иметь доступа к сотням людей для тестирования своей игры, получит доступ к этому инструменту обучения с агентами, которые оптимизируют игру. Они могут самостоятельно изучить игру, без написания скриптов, а затем сказать вам, где проблемы в балансе. Это позволяет вам сравнить свои теории дизайна с тем, что происходит, в реальном времени».

Ранее искусственный интеллект AlphaStar смог выиграть 99,9 % игроков в StarCraft II. И хотя он был направлен на победу в матче, а не занимался тестированием баланса, это показательный пример использования машинного обучения на практике.

Технический директор Microsoft призвал развивать телемедицину для провинции

Предпринимаемые властями и корпорациями меры по оптимизации инфраструктуры в условиях пандемии преимущественно сосредоточены в мегаполисах, и на периферийных территориях не всегда удачно тиражируются. Проблема характерна даже для США, как считает технический директор Microsoft, который родился и вырос в небольшом городке в Вирджинии.

Источник изображения: Microsoft

Источник изображения: Microsoft

Кевин Скотт (Kevin Scott) в своей книге «Перепрограммируя американскую мечту», написанной в соавторстве с Грегом Шоу (Greg Shaw), рассуждает об особенностях развития малых городов Америки. Он сам вырос в небольшом городке в штате Вирджиния, который при численности населения чуть больше 50 тысяч человек жил в основном за счёт малого бизнеса и фермерской деятельности. Технический директор Microsoft с 2003 года принимает участие в разработке систем машинного обучения, и теперь он считает, что искусственный интеллект поможет жителям американской провинции, особенно в условиях пандемии и самоизоляции.

Основная часть примитивного и тяжёлого физического труда будет автоматизирована, как считают авторы книги. Современные инициативы по обеспечению граждан всем необходимым в условиях самоизоляции, по словам Скотта, сосредоточены в крупных городах, но и жителям отдалённых районов предлагаемые меры могут облегчить существование. У Кевина Скотта есть живой пример — его одиноко проживающая 90-летняя бабушка в центральной части Вирджинии пока ещё способна обслуживать себя самостоятельно, но если ситуация изменится к худшему, автоматизированные средства доставки товаров и медикаментов могли бы здорово ей пригодиться.

Другая проблема, характерная для периферийных территорий многих стран — доступ к качественному медицинскому обслуживанию. Здесь на помощь могла бы прийти телемедицина в сочетании с тем же искусственным интеллектом. Специалисты IBM уже продемонстрировали эффективность использования суперкомпьютера Watson для анализа результатов медицинской диагностики и помощи специалистам в определении диагноза. Скотт предлагает использовать биометрию для ранней диагностики проблем со здоровьем у жителей отдалённых населённых пунктов и контроля за распространением заболеваний.

Ещё одна сфера применения систем искусственного интеллекта в провинциальных городах — это оптимизация видеосвязи, с учётом не самой высокой пропускной способности местной сетевой инфраструктуры. Качество звука и видео может динамически подстраиваться с оглядкой на степень загрузки сети, а искусственный интеллект даже может частично компенсировать выпадающие фрагменты видеопотока.

Скотт также не является сторонником прямых денежных компенсаций гражданам со стороны правительства. По его словам, целесообразнее было бы потратить средства на инфраструктурные улучшения, которые сделали бы товары и услуги более дешёвыми. В этом случае даже в условиях кризиса одной и той же суммы гражданам хватило бы на более длительный срок.

Разработчики Microsoft ежемесячно допускают 30 000 ошибок в ПО и сервисах

Microsoft рассказала о том, как обрабатываются ошибки, допускаемые разработчиками в программном обеспечении и сервисах. Для выявления ошибок используется модель машинного обучения, которая с эффективностью в 99 % ежемесячно находит около 30 тысяч ошибок в ПО и сервисах, совершаемых 47 тысячами разработчиков Microsoft.

Допускаемые в процессе разработки ошибки отслеживаются в репозиториях GitHub и AzureDevOps, но обнаруживать их все традиционными способами крайне затруднительно. Поэтому в Microsoft применяется модель машинного обучения, которая использует собранные за 20 лет данные о 13 млн ошибок. Такая система эффективно выявляет допущенные ошибки в 99 % случаев, а также помогает разработчикам определять приоритеты критических проблем безопасности, которые необходимо устранить.   

«Наша цель заключалась в создании системы машинного обучения, способной классифицировать выявленные ошибки на опасные, безопасные, критические и некритические с точностью, максимально приближенной к уровню эксперта по безопасности», — сказал Скотт Кристиансен (Scott Christiansen), старший менеджер по безопасности программ в Microsoft. Он также отметил, что в настоящее время применяемая Microsoft модель поиска ошибок с точностью в 99 % выявляет ошибки безопасности и в 97 % случаев осуществляет их верную маркировку. Система постоянно развивается, обучаясь за счёт анализа новых данных, проверенных экспертами по безопасности Microsoft.

Источник отмечает, что для компании уровня Microsoft является странным публичное объявление о том, сколько ошибок допускают разработчики и каким образом они устраняются. Предполагается, что в будущем Microsoft планирует предлагать использование своей технологии поиска и маркировки ошибок другим компаниям.

Шаг к пониманию: магнитная трековая память может работать подобно нейронам в мозге человека

Машинное обучение и алгоритмы искусственного интеллекта требуют собственной процессорной базы, а не процессоров общего назначения. Это необходимо для оптимизации работы нейронных сетей при обработке массивов данных. В идеале необходимо создать кремниевый аналог головного мозга человека. Впрочем, кремний не отвечает поставленным целям. Решением может стать электроника на основе взаимодействия магнитных полей.

Группа исследователей из Инженерной школы Кокрелла при Техасском университете в городе Остин провела серию экспериментов по использованию магнитных цепей для энергоэффективной обработки больших данных. Статья о работе опубликована в журнале IOP Nanotechnology (доступ платный). Учёные на практике убедились во взаимном и продуктивном взаимодействии пары магнитных переходов в виде так называемых доменных стен (пограничных переходов намагниченности).

Магнитные взаимодействия между двумя соседствующими логическими элементами, а каждая доменная стена в рамках трековой памяти ― это логические 0 или 1, приводят к ослаблению одного из них. Для схем на классической кремниевой логике для этого потребовались бы специальные корректирующие цепи, которые бы донесли реакцию одного элемента до другого. Магнитное взаимодействие, как оказалось, автоматически подавляет сигнал соседнего элемента без каких-либо дополнительных цепей через «пространство и время». Фактически бесплатно.

Принцип работы трековой памяти в представлении IBM

Принцип работы трековой памяти в представлении IBM

Подобным образом действуют нейроны в головном мозге человека. Наиболее быстро возбудившийся нейрон подавляет активность других нейронов в слое, где он находится. Нет нужды лишний раз объяснять, что головной мозг после миллионов лет эволюции выполняет свои задачи наиболее эффективным образом. Так и с магнитными доменами. Если вместо сложной кремниевой логики с массой обратных связей создать взаимно влияющие друг на друга массивы доменных стен с более простой реализацией связей, то это существенно снизит энергетические затраты на обработку данных.

В сфере машинного обучения описанный выше эффект называется поперечным торможением и реализуется с помощью сложной логики. Магнитные элементы, как видим, упрощают схемотехнику для реализации тех же алгоритмов. Исследователи из Техасского университета смогли показать это на модели из двух магнитных элементов и вывели математическую модель для массива из 1000 элементов. На следующем этапе они намерены провести эксперименты с множеством магнитных элементов.

window-new
Soft
Hard
Тренды 🔥