Сегодня 25 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → машинное зрение

Представлен самообучающийся робот-гуманоид Menteebot с мощным машинным зрением для дома и промышленности

Амнон Шашуа (Amnon Shashua) известен как основатель стартапа машинного зрения Mobileye и компании по изучению искусственного интеллекта AI21 Labs. В 2022 году, опираясь на полученный в этих сферах опыт, он создал Mentee Robotics —стартап в области робототехники. Сегодня компания представила гуманоидного робота Menteebot, главными преимуществами которого создатель называет продвинутое машинное зрение и обучающийся генеративный ИИ.

 Источник изображений: Mentee Robotics

Источник изображений: Mentee Robotics

«Мы находимся на пороге сближения компьютерного зрения, понимания естественного языка, мощных и детальных симуляторов, а также методологий перехода от моделирования к реальному миру, — заявил Шашуа. — В Mentee Robotics мы рассматриваем эту конвергенцию как отправную точку для разработки будущего универсального двуногого робота, который сможет передвигаться повсюду (как человек) с помощью мозга, выполняя работу по дому и осваивая новые навыки, которым он ранее не был обучен».

Представленный робот во многом является прототипом, хотя его создатели считают, что добились достаточного прогресса, чтобы оправдать публичный дебют после двух лет напряжённой работы. Творческий и инженерный состав Mentee Robotics впечатляет. Помимо Шашуа, в команду основателей входят бывший директор Facebook по исследованиям ИИ Лиор Вольф (Lior Wolf) и профессор Еврейского университета в Иерусалиме Шай Шалев-Шварц (Shai Shalev-Shwartz). Эта команда при содействии венчурной фирмы Ahren Innovation Capital помогла привлечь инвестиции в размере $17 млн.

«Большие языковые модели используются для интерпретации команд и “продумывания” необходимых шагов для выполнения задачи. Особое внимание уделяется способности сочетать передвижение и ловкость, то есть динамическое балансирование робота при переносе тяжестей или движении манипуляторов», — говорится в пресс-релизе компании.

Mentee Robotics утверждает, что новый робот адаптирован как для промышленного, так и для потребительского рынков, в отличие от конкурирующих моделей. Компания рассчитывает выпустить готовый к производству прототип к началу 2025 года.

Илон Маск объявил, что следующий имплант Neuralink подарит зрение слепым

Основатель и владелец компании Neuralink Илон Маск (Elon Musk) анонсировал следующий продукт Neuralink — Blindsight (дословно — «Слепое зрение»). Это устройство предназначено для восстановления зрения. Ещё несколько лет назад Илон Маск заявил, что Neuralink сможет вернуть зрение слепым людям. Теперь, после успешной демонстрации игры в шахматы при помощи мозгового импланта, исполнение обещаний Маска кажется делом недалёкого будущего.

 Источник изображения: Computerra

Источник изображения: Computerra

«Первое применение, к которому мы собираемся стремиться у людей, — это восстановление зрения, и даже если у кого-то никогда не было зрения, как если бы он родился слепым, мы верим, что все равно можем восстановить зрение. Зрительная часть коры все ещё существует. Даже если они никогда раньше не видели, мы уверены, что они смогут увидеть», — заявил Маск на Neuralink Show & Tell в 2022 году.

«Вы хотите иметь возможность читать сигналы мозга. Вы хотите иметь возможность записывать сигналы. В конечном итоге вы хотите иметь возможность сделать это для всего мозга, а затем распространить это на остальную часть вашей нервной системы, если у вас повреждён спинной мозг или шея», — добавил он.

В ноябре 2023 года Илон Маск сообщил, что Neuralink работает над чипом машинного зрения, но на его подготовку уйдёт несколько лет. В то время компания была сосредоточена на получении одобрения регулирующих органов на свои первые испытания на людях. 20 марта 2024 года Маск в своём аккаунте социальной сети X опубликовал короткое сообщение о следующем продукте компании.

 Источник изображения: Twitter

Источник изображения: Twitter

Позже Маск добавил, что имплант Blindsight уже тестируется на обезьянах. «Поначалу разрешение [искусственного зрения] будет низким, как в ранней графике Nintendo, но в конечном итоге может превысить нормальное человеческое зрение», — написал Маск в X и добавил, что ни одна обезьяна не погибла и не получила серьезных травм от устройства Neuralink.

В январе этого года первый парализованный доброволец перенёс операцию по установке в черепную коробку импланта Neuralink, который позволил ему научиться управлять курсором на ноутбуке буквально при помощи мысли. Компания на этой неделе опубликовала видео, демонстрирующие обретённые после этой операции добровольцем новые физические возможности.

Нейросети помогут в поиске мелкого космического мусора

Европейские учёные предложили адаптировать популярные ИИ-алгоритмы систем машинного зрения для анализа сделанных при помощи радаров снимков околоземного пространства и обнаружения на них миниатюрных частиц космического мусора.

 Источник изображения: nasa.gov

Источник изображения: nasa.gov

Исследователи провели эксперимент, применив существующие нейросети, используемые в системах машинного зрения, для анализа данных с европейского радара TIRA — это 47-метровая радиотарелка, которая помогает наблюдать за околоземным пространством и получать изображения, на которых производится поиск космического мусора.

Авторы проекта попытались заменить стандартные алгоритмы анализа данных TIRA нейросетями семейства YOLO, которые применяются для поиска движущихся объектов на снимках. Версии нейросетей YOLOv5 и YOLOv8 обучили при помощи массива из 3000 снимков околоземного пространства и проверили их эффективность на примере 600 изображений с радаров, на которых были от одного до трёх частиц космического мусора.

Обе нейросети корректно обнаружили от 85 % до 97 % частиц размером от сантиметра при минимальном числе ложных срабатываний. Результат оказался выше того, что демонстрирует стандартный алгоритм TIRA. Учёные сделали вывод, что системы машинного зрения могут успешно применяться для поиска космического мусора в околоземном пространстве и для его отслеживания в реальном времени. Это поможет снизить число инцидентов, связанных с попаданием частиц космического мусора в работающие орбитальные аппараты.

По оценкам экспертов, на орбите Земли могут находиться более 170 млн частиц космического мусора.

Китайцы разработали процессор для машинного зрения, который в 3000 раз быстрее и в 4 млн раз эффективнее современного GPU

Учёные из китайского университета Цинхуа разработали полностью аналоговый фотоэлектронный чип ACCEL, который обещает совершить революцию в задачах высокоскоростного машинного зрения. Чип, сочетающий электронные и оптические технологии, способен продемонстрировать беспрецедентную энергоэффективность и высочайшую скорость вычислений для задач машинного зрения. В этой сфере новый чип радикально превосходит современные графические процессоры.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Традиционные процессоры обладают ограниченной скоростью вычислений и потребляют колоссальное количество энергии при решении задач машинного зрения, таких как распознавание изображений для автономного вождения, робототехники и медицинской диагностики. Эти задачи требуют обработки изображений с высоким разрешением, точной классификации и сверхнизкой задержки.

Чип ACCEL реализует преимущества развивающейся области фотонных вычислений, которые используют свет для обработки информации. Интегрируя дифракционные оптические аналоговые вычисления (OAC) и электронные аналоговые вычисления (EAC) в одном чипе, ACCEL достигает замечательной энергоэффективности и скорости вычислений.

Метод OAC использует управление световыми волнами посредством дифракции для кодирования и обработки информации. При помощи интерференционных паттернов, создаваемых светом, вычисления производятся аналоговым способом, обрабатывая данные непрерывно, а не дискретными цифровыми шагами. Метод EAC использует электронные компоненты для манипулирования непрерывными физическими величинами. Вместо работы с цифровыми сигналами в виде нулей и единиц, EAC использует постоянно меняющиеся аналоговые сигналы.

 Архитектура ACCEL / Источник изображения: Tsinghua University

Архитектура ACCEL / Источник изображения: Tsinghua University

Оба метода дают преимущества для определённых видов вычислений и способствуют разработке задач высокоскоростного зрения.

ACCEL при обработке изображений не требует АЦП для преобразования изображения, напрямую используя для вычислений фототоки, индуцированные светом, что приводит к значительному сокращению задержек. ACCEL достигает системной энергоэффективности 74,8 пета-операций в секунду на ватт, что более чем на три порядка выше, чем у современных графических процессоров. Скорость вычислений достигает 4,6 пета-операций в секунду, при этом более 99 % вычислений выполняются оптически.

Благодаря интеграции оптоэлектронных вычислений и адаптивного обучения ACCEL достигает конкурентоспособной точности классификации объектов в различных задачах. Новый чип продемонстрировал точность 85,5 %, 82,0 % и 92,6 % для задач Fashion-MNIST, 3-классовой классификации ImageNet и задач распознавания покадрового видео соответственно. Примечательно, что ACCEL демонстрирует высокую надёжность даже в условиях низкой освещённости, что делает его пригодным для портативных устройств, автономного вождения и промышленных применения.

 Сравнение скорости и энергоэффективности ACCEL с традиционными методами / Источник изображения: Tsinghua University

Сравнение скорости и энергоэффективности ACCEL с традиционными методами / Источник изображения: Tsinghua University

Сверхнизкое энергопотребление нового чипа значительно снижает тепловыделение, открывая путь дальнейшему совершенствованию и миниатюризации. В отличие от традиционных оптоэлектронных цифровых вычислительных систем, ACCEL гибко сочетает дифракционные оптические вычисления и электронные аналоговые вычисления, а его архитектура обеспечивает масштабируемость, нелинейность и высокую адаптируемость.

В исследовании, опубликованном в журнале Nature, исследователи заявили: «Разработка вычислительной системы, основанной на совершенно новом принципе, является огромной задачей. Однако ещё более важно успешно реализовать эту вычислительную архитектуру следующего поколения в реальные приложения, отвечающие важнейшим потребностям общества».

В рецензии на исследование, опубликованной в журнале Nature's Research Briefing, эксперты высказали убеждение, что «ACCEL может позволить этим архитектурам сыграть роль в нашей повседневной жизни гораздо раньше, чем ожидалось».

Всё новое — это, несомненно, хорошо забытое старое. Самым первым аналоговым вычислительным устройством является хорошо знакомая старшему поколению логарифмическая линейка.

 Источник изображения: myruler.ru

Источник изображения: myruler.ru

Другим известным примером аналоговых вычислительных устройств является настольная аналоговая вычислительная машина МН-7, разработанная в далёком 1955 году. Она успешно решала обыкновенные дифференциальные уравнения до 6-го порядка. Не менее успешно при помощи подобных машин создавались математические модели физических процессов, что использовалось при решении задач АСУ ТП.

 Источник изображения: computerra.ru

Источник изображения: computerra.ru

В аналоговой вычислительной машине (АВМ) мгновенному значению исходной переменной величины ставится в соответствие мгновенное значение другой величины, часто отличающейся от исходной физической природой и масштабным коэффициентом. Каждой элементарной математической операции, как правило, соответствует физический закон, устанавливающий математические зависимости между физическими величинами на выходе и входе (например, закон Ома).

Особенности представления исходных величин и построения алгоритмов предопределяют большую скорость работы АВМ и простоту программирования, но ограничивают область применения и точность получаемого результата. АВМ отличается малой универсальностью (алгоритмическая ограниченность) — при решении задач другого класса необходимо перестраивать структуру машины и число решающих элементов.

А теперь мы становимся свидетелями того, как в мире, казалось бы, победивших цифровых технологий, вновь начинают находить применение аналоговые вычисления, вышедшие на новый уровень развития.

Впервые технология обнаружения объектов вне прямой видимости добилась высокого разрешения — можно будет даже читать вывески за углом

Автопилоты и другая роботизированная техника учится лучше и глубже оценивать дорожную обстановку, чем водитель-человек. В это ей помогают также технологии обнаружения объектов вне прямой видимости. Однако из множества технологий визуализации объектов «за углом» до сих пор не было способа получить картинку в высоком разрешении. Учёные из Калифорнийского технологического института заполнили этот пробел, предложив новую технологию UNCOVER.

 Источник изображения: Caltech

Источник изображения: Caltech

Традиционно «за угол» можно заглянуть, если проанализировать в зоне прямой видимости свет, отражённый от других объектов, например, от стен. Поскольку свет от таких объектов рассеивается, более-менее цельное изображение можно собрать с помощью ИИ-алгоритмов. Но если рядом с искомой целью есть точечный источник света — guidestar (путеводная звезда), то скрытый объект можно рассмотреть намного детальнее.

Свет от точечного источника позволяет вычислить волновые фронты отражённого от стен света и использовать эту информацию для расчёта светового потока от наблюдаемого скрытого объекта. Проблема в том, что в обычной дорожной обстановке подсветить скрытые объекты никак невозможно. В противном случае каждому пешеходу и каждой машине на улице пришлось бы придать свою собственную «путеводную звезду».

Технология UNCOVER позволяет использовать как guidestar сам скрытый объект. В эксперименте учёные показали возможность различить находящиеся вне зоны прямой видимости сложные символы в виде звёздочки, геометрических фигур и букв. Предложенная технология, уверены учёные, поможет улучшить автопилоты на улицах городов и роверов на далёких планетах. Марсоходу не нужно будет пробираться по труднопреодолимым преградам, чтобы осмотреть скрытые за ними объекты. Если вокруг светло, он получит картинку даже за линией прямой видимости.


window-new
Soft
Hard
Тренды 🔥
Релиз Fallout: London ближе, чем можно было подумать — мод для Fallout 4 размером с аддон получил новую дату выхода 20 мин.
CrowdStrike решила загладить вину за глобальный сбой ПК подарочными картами на $10, но они не работают 54 мин.
Победа: разработчики Apex Legends отменили скандальное изменение боевых пропусков на фоне массовой критики 2 ч.
CrowdStrike обвинила в недавнем глобальном сбое ПК на Windows баг в ПО для тестирования апдейтов 3 ч.
«Это издевательство над фанатами Borderlands»: финальный трейлер фильма «Бордерлендс» разозлил игроков 3 ч.
Журналисты нашли подтверждение существования ПК-версии Stellar Blade 4 ч.
Стратегия Ratten Reich отправит игроков в мир бесконечных войн крыс, мышей, ящериц и тараканов — трейлер с датой выхода в раннем доступе Steam 6 ч.
В X теперь можно получить сводку от ИИ о любом пользователе, но алгоритм часто ошибается 6 ч.
Госдума приняла законопроект о майнинге в первом чтении — добычу криптовалют в некоторых регионах РФ могут запретить 7 ч.
YouTube заработал на рекламе $8,66 млрд во втором квартале, но на Уолл-стрит ожидали большего 8 ч.
Электрические спорткары Xiaomi SU7 Ultra начнут массово выпускаться в первой половине 2025 года 51 мин.
Разгадку тайны тёмной материи учёные поискали в аномалиях пульсаров 6 ч.
На старте продаж Ryzen 9000 обзоров будет мало — многие СМИ ещё не получили образцы 6 ч.
В Atos назначен новый гендиректор — шестой за три года 6 ч.
AMD представила самый мощный процессор Ryzen AI 300 — у него 12 ядер Zen 5 и 5c, а также NPU на 55 TOPS 7 ч.
AWS закупит топливные элементы Bloom на 20 МВт для будущего ЦОД в Кремниевой долине 7 ч.
Илон Маск показал суперкомпьютер Dojo для обучения автопилота Tesla — он эквивалентен 8000 ИИ-ускорителей Nvidia H100 8 ч.
AOC представила 27-дюймовый офисный монитор U27B3CF с 4K и разъёмом USB-C 8 ч.
Обнаружено неожиданное препятствие для безопасного полёта людей на Марс — срок годности лекарств 9 ч.
LG представила первый 34-дюймовый WQHD-смарт-монитор — MyView Smart Monitor 34SR65QC с webOS и стриминговыми сервисами 10 ч.