Опрос
|
Быстрый переход
Нейросеть «Яндекса» научилась генерировать короткие видео в «Шедевруме»
28.08.2023 [13:26],
Андрей Крупин
Команда разработчиков «Яндекса» сообщила о расширении возможностей мобильного приложения «Шедеврум» и реализации в программе функции создания коротких видеороликов с помощью генеративной нейросети. Утверждается, что компания стала первой на российском рынке, предложившей подобную технологию широкой аудитории. ![]() Источник анимации: «Яндекс» Для того, чтобы сгенерировать видео в «Шедевруме», достаточно описать текстом то, что хочется увидеть. В ответ приложение предложит четыре варианта первого кадра и набор анимационных эффектов для создания движения. Всего доступно семь эффектов: зум (приближение), таймлапс (ускоренная перемотка), полёт, панорама, вращение, подъём и морфинг (постепенное изменение). Для создания кадров будущего видео используется метод каскадной диффузии. С помощью этой технологии «Шедеврум» генерирует отдельные изображения. Сначала нейросеть создаёт картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. «Шедеврум» генерирует видео длиной четыре секунды с частотой 24 кадра в секунду. После публикации ими можно поделиться с друзьями или сохранить в формате MP4. В настоящий момент функция работает в режиме тестирования и доступна в обновлённой версии приложения активным пользователям «Шедеврума». «Яндекс» представил «Шедеврум» для Android и iOS в апреле 2023 года. В основу программы положена нейронная сеть, содержащая 5 миллиардов параметров и обученная на 330 миллионах примеров изображений с текстовым описанием. В планах разработчика — обучение нейросети новым знаниям и её внедрение в другие сервисы и продукты компании. Новая статья: Свёрточные нейронные сети — надежда и опора генеративного ИИ
25.08.2023 [00:22],
3DNews Team
Данные берутся из публикации Свёрточные нейронные сети — надежда и опора генеративного ИИ Intel показала работу нейросетевого VPU-сопроцессора Meteor Lake в редакторе изображений
29.05.2023 [19:52],
Николай Хижняк
Компания Intel продемонстрировала в рамках выставки электроники Computex работу инженерного образца процессора из будущей серии Meteor Lake в задаче, связанной с работой алгоритмов генеративной нейронной сети. ![]() Источник изображений: Intel Будущие процессоры Intel Meteor Lake используют децентрализованный, а не монолитный дизайн, позволяющий использовать комбинации различных чиплетов на основе разных технологических процессов. Одной из ключевых особенностей процессоров Meteor Lake станет специальный нейронный движок VPU (Versatile Processing Unit), основанный на третьем поколении технологии компании Movidius, которую Intel купила в 2016 году. Данный нейронный движок предназначен для ускорения работы процессоров Meteor Lake в задачах, связанных с различными ИИ-алгоритмами и моделями машинного обучения. Одной из базовых задач VPU в процессорах Meteor Lake станет фото- и видеоредактирование и применение фильтров в режиме реального времени. Он сможет накладывать эффекты размытия, применять автоматическое масштабирование и заменять фон изображений. Также он получит способность в реальном времени распознавать движение глаз пользователя и жесты. Производительности нейродвижка должно даже хватить для захвата движений с помощью Unreal Engine. Блок VPU будет достаточно мощным, чтобы поддерживать генеративные возможности ИИ, включая, например, запуск нейросети Stable Diffusion. Наличие VPU для работы с такими моделями необязательно, главное иметь достаточный объём памяти, однако использование аппаратных возможностей CPU, GPU и APU позволяет существенно ускорить работу модели ИИ. Для задействования возможностей VPU компания Intel сотрудничает с GIMP и Adobe, чтобы те добавили поддержку нейронного движка компании в свои продукты. В рамках выставки Computex компания Intel продемонстрировала работу инженерного образца мобильного процессора Meteor Lake с маркировкой Intel 0000, в состав которого входят 16 физических ядер с поддержкой 22 виртуальных потоков. По данным портала Wccftech, чип имеет конфигурацию из 6+8+2 ядер и его финальное воплощение будет относится к серии Meteor Lake-P. Конфигурация ядер у процессора весьма необычная. Производительные P-ядра и энергоэффективные E-ядра находятся в составе основного кристалла CPU. А два дополнительных ядра расположены внутри кристалла SoC. В режиме простоя чип работал на частоте 0,37 ГГц. Базовая частота процессора составляет 3,1 ГГц. Он суммарно имеет 1,6 Мбайт кеш-памяти первого уровня, 18 Мбайт кеш-памяти L2 и 24 Мбайт кеш-памяти L3. Демонстрация работы инженерного образца Meteor Lake проводилась в редакторе изображения GIMP с поддержкой ИИ-модели Stable Diffusion для генерации изображений по заданным параметрам, а затем к результату применялся ИИ-плагин для увеличения разрешения. Для задействования в работе VPU использовалась библиотека Intel OpenVINO для разработки приложений компьютерного зрения и искусственного интеллекта. Выпуск мобильных процессоров Meteor Lake ожидается к концу текущего года. Компания не комментирует последние слухи о том, что настольные Meteor Lake-S могли быть отменены. В то же время, производитель пока не подтверждает планов по их выпуску. Нейросети Chat GPT и Sage не смогли сдать «на отлично» российский университетский экзамен по истории
18.05.2023 [13:27],
Владимир Мироненко
Историки Уральского федерального университета (УрФУ) провели эксперимент, который выявил слабости нейросетей Chat GPT и Sage, сообщает ТАСС со ссылкой на пресс-службу учебного заведения. По словам учёных, нейросети не могут сдать вузовский экзамен по истории «на отлично», поскольку не воспринимают нюансы языков разных эпох и к тому же заполняют пробелы в знаниях выдуманными фактами. ![]() Источник изображения: Pixabay В вузе отметили, что нейросети проявили компетентность в ответах на вопросы, связанные с использованием устойчивой общей научной терминологии. Однако они владеют только современным русским языком и не воспринимают нюансы языков разных эпох. А ведь историку помимо современного русского языка приходится иметь дело с его версиями нескольких эпох, включая терминологию XVI века в нескольких вариантах (церковнославянский язык, язык деловой письменности, разговорный), XIX века, советско-марксистский язык XX века. Принимавший «экзамен» доцент кафедры истории России УрФУ Михаил Киселев поставил нейросетям «тройку», назвав их «студентом-импровизатором». Преподаватель отметил, что «там, где материал имеет однозначные ответы, нейросеть отвечает нормально, адекватно, но в остальном она имитирует самостоятельные рассуждения, попросту выдумывая факты, несуществующие работы или авторов». Например, на просьбу назвать историков, которые писали о завещании Василия III, обе нейросети сначала заявили, что об этом «писали многие историки», после чего назвали наиболее известных дореволюционных учёных, авторов обобщающих работ по истории России, хотя правильный ответ легко найти в поисковых системах. «Примечательно, что нейросети наравне с реальными историками и их работами могут выдумывать как историков, так и книги. Sage назвала некоего Александра Васильевича Пильяра, а Chat GPT заявил, что Андрей Краевский якобы написал книгу “История Российского государства”. Если представить, что такая беседа велась на экзамене, то можно сказать, что студент “поплыл” из-за неглубокой проработки материала, хотя и старался держаться уверенно, пытаясь доказать противоположное», — рассказал Киселев. Google открыла доступ к нейросети MusicLM, которая позволяет создавать музыку по текстовому описанию
11.05.2023 [07:07],
Алексей Разин
Поскольку искусственному интеллекту уже под силу сочинение сложных текстов и написание картин, привлечение его ресурсов для сочинения музыки было лишь вопросом времени, и соответствующие эксперименты уже вовсю ведутся. Google решила не отставать от тенденции и продемонстрировала приложение MusicLM, которое позволяет создавать музыкальные композиции по текстовому описанию. ![]() Источник изображения: Google Ещё в январе, впервые описывая данный инструмент, Google заявляла об отсутствии планов по его выпуску в открытый доступ, но за прошедшее время изменила своё отношение. MusicLM доступна в составе AI Test Kitchen для Android и iOS участникам программы тестирования, требующей отдельной регистрации. По текстовому описанию музыкальной композиции система способна создавать два варианта произведений, из которых пользователь сможет выбрать более подходящий. Текстовое описание может содержать информацию не только об инструментальном содержании трека, но и о желаемом эмоциональном эффекте, который он создаёт. Google пытается избежать упрёков со стороны правообладателей, поэтому MusicLM не будет создавать музыкальные произведения, содержащие вокал конкретных исполнителей. Юридические аспекты имитации отдельных музыкальных произведений тоже заставляют задуматься о перспективах использования результатов работы MusicLM в коммерческой сфере. Платформам, связанным с распространением музыки, уже приходилось сталкиваться с необходимостью удалить ряд произведений, созданных с помощью искусственного интеллекта. Тестировщики оценивают ответы ИИ-бота Google Bard наугад, чтобы не терять деньги
05.04.2023 [22:05],
Владимир Фетисов
Компания Google в прошлом месяце начала ограниченное бета-тестирование своего ИИ-чат-бота Bard. С тех пор сотрудники некоторых крупных подрядчиков IT-гиганта участвуют в тестировании нейросети, а также проверяют точность выдаваемых им ответов. Оказалось, что зачастую участникам тестирования не хватает времени на проверку ответов Bard, из-за чего им приходится давать оценку наугад. ![]() Источник изображения: Google Так, сотрудники компании Appen, которые помогают Google в тестировании алгоритма Bard, на условиях анонимности сообщили представителям СМИ, что им не хватает времени на осмысленную оценку ответов, выдаваемых ИИ-ботом. В полученных ими инструкциях сказано, что в процессе тестирования необходимо подготовить запрос для чат-бота, а после получения двух ответов выбрать наиболее связный и корректный ответ. У них также есть возможность добавить комментарий, чтобы объяснить, почему выбран тот или иной вариант. Участники тестирования отмечают, что на обработку каждого запроса даётся несколько минут, но иногда на это отводится только 60 секунд. Зачастую дать корректную оценку полученного от чат-бота ответа за такое время весьма затруднительно, особенно в случаях, когда запрос связан с малознакомой темой. Оплата за эту работу начисляется на основе времени, выделяемого для решения каждой задачи. Чтобы не терять деньги тестировщикам приходится выполнять задачи за отведённое время даже в случаях, когда они не уверены в том, какой из предложенных ИИ-алгоритмом ответов является более точным. Проще говоря, чтобы не терять деньги участники тестирования вынуждены наугад выполнять задания, поскольку им не хватает времени на качественную проверку ответов Bard. Источник отмечает, что сотрудники подрядных организаций Google всё чаще призывают к улучшению условий труда. Ещё в феврале участники бета-тестирования системы Bard передали петицию руководству Google с призывом повысить оплату труда. Согласно имеющимся данным, сотрудники Appen, участвующие в тестировании Bard, зарабатывают от $14 до $14,50 в час. Представлен транзистор для кремниевого мозга — он точно имитирует работу человеческого синапса
09.03.2023 [21:04],
Геннадий Детинич
Французский исследовательский центр CEA-Leti разработал транзистор с примерно 50 состояниями, а не с двумя, как у современной цифровой электроники. «Аналоговый» транзистор имитирует работу синапсов в нервной ткани человеческого мозга и делает это довольно близко по таким характеристикам, как энергопотребление и скорость. Планируется, что на основе новых транзисторов будут построены нейронные процессоры нового поколения с впечатляющими возможностями. ![]() Источник изображения: Pixabay Возможно, эта разработка ближе всего подошла к имитации того, как взаимодействуют нейроны мозга, считают в CEA-Leti. Транзистор также миниатюрен как синапс, потребляет столько же и работает на том же принципе — срабатывает не по одному импульсу, а после прихода критической «массы» сигналов. Синапс ведь не отзывается на одиночные нервные импульсы. Для запуска сигнала дальше по нервной сети требуются множественные стимулирующие реакции через синапсы. Только тогда конкретный нейрон запустит потенциал по своей сети дендритов для передачи информации другим связанным с ним нейронам. Другое сходство между новым транзистором и синапсом заключается в том, что оба они являются ионными. Транзистор использует преимущества той же электрохимической реакции, что и синапс. В случае с транзистором его канал состоит из оксида титана, через который проходят ионы лития. В зависимости от их количества они изменяют электронную проводимость канала. Благодаря этому транзистор потребляет 1 фДж/мкм2, столько же, сколько синапс. Это в 100 раз меньше, чем у других возможных решений, включая перспективную резистивную память. Толщина транзистора всего 200 нм, а число циклов переключения более 100 тыс. Исследователи научились выпускать массивы транзисторов на 200-мм кремниевых пластинах с использованием стандартных КМОП-совместимых техпроцессов. Массивы транзисторов были испытаны в работе на эталонном тесте MNIST на распознавание изображений и показали хороший результат. Но предстоит ещё большая работа по подтверждению квалификации транзисторов для использования в нейронных чипах. «Все эти элементы обнадеживают, но мы находимся только на первых этапах процесса оценки. Мы должны продолжать доводить транзистор до зрелости и обеспечить углубленную оценку его долговечности и надежности», — объяснил один из учёных из CEA-Leti. ChatGPT нашли ещё одно применение: нейросеть написала речь для американского конгрессмена
27.01.2023 [23:47],
Владимир Фетисов
На этой неделе американский конгрессмен Джейк Окинклосс (Jake Auchincloss) выступил в Палате представителей с речью, которая была сгенерирована с помощью чат-бота ChatGPT от компании Open AI. Своей речью он хотел привлечь внимание законодателей к важности технологий на основе искусственного интеллекта и необходимости их дальнейшего развития. ![]() Источник изображения: freepik.com Небольшая речь конгрессмена была посвящена необходимости принять закон о создании американо-израильского центра искусственного интеллекта для дальнейшего развития нейросетей и их интеграции в разные сферы деятельности человека. Окинклосс вместе с помощниками дали чат-боту ChatGPT задание «написать 100 слов для выступления в Палате представителей» в поддержку упомянутого законопроекта. Согласно имеющимся данным, ИИ-алгоритму потребовалось несколько попыток, чтобы сформировать текст, который и был зачитан в Палате представителей. «ИИ может стать технологией общего назначения: основополагающей в каждом секторе. Вчера я выступил в Конгрессе с первой речью, сгенерированной с помощью ИИ, в качестве призыва к действию. Политики должны быть целеустремлёнными и активными», — написал Окинклосс на своей странице в сети Twitter. Успех ChatGPT позволил разработчику алгоритма Open AI привлечь значительные инвестиции. Не так давно Microsoft объявила о расширении долгосрочного партнёрства с компанией за счёт «многолетних многомиллиардных инвестиций». Ранее появлялись сообщения о намерении софтверного гиганта вложить в Open AI $10 млрд. Крупнейшее академическое издательство Springer Nature не разрешит указывать ChatGPT в качестве автора статей
26.01.2023 [19:54],
Владимир Фетисов
Springer Nature, крупнейшее в мире академическое издательство, разъяснило свою позицию в отношении использования программных средств написания текстов на основе продвинутых языковых моделей, таких как ChatGPT. На этой неделе компания объявила, что подобное программное обеспечение не может указываться в качестве автора статей, которые публикуются в тысячах журналов издательства. ![]() Источник изображения: Pixabay При этом в Springer Nature отметили, что компания не против использования ИИ-алгоритмов для генерации идей или помощи в написании текстов, если такой материал в полной мере раскрывается автором. «Мы чувствовали необходимость прояснить нашу позицию: для наших авторов, наших редакторов и нас самих. Новое поколение языковых моделей, таких как ChatGPT, действительно взорвало сообщество, которое по праву радуется и играет с ними, но также использует их способами, которые выходят за рамки того, как они действительно могут быть применены в настоящее время», — рассказала Магдалена Скиппер (Magdalena Skipper), главный редактор издания Nature. Ранее ChatGPT и некоторые другие языковые модели указывались в качестве авторов в небольшом количестве опубликованных статей, в том числе в научных публикациях. Однако характер и степень вклада ИИ-алгоритмов в создание публикаций варьируется от случая к случаю. Реакция научного сообщества на статьи, в которых ChatGPT указывался в качестве автора, была преимущественно негативной. Основной аргумент против присвоения авторства ИИ-алгоритмам заключается в том, что программное обеспечение попросту неспособно выполнять необходимые обязательства. «Когда мы думаем об авторстве научных статей, исследовательских работ, мы думаем не только об их написании. Есть обязанности, которые выходят за рамки публикации, и, конечно, в настоящее время ИИ-инструменты не способны взять на себя эти обязательства», — считает Скиппер. Очевидно, имеется ввиду то, что программное обеспечение не может нести ответственность за публикации, не может претендовать на права интеллектуальной собственности на свои работы, не может вести переписку с другими учёными и прессой, чтобы рассказать о своих работах и ответить на возникающие вопросы. «Наша политика в этом вопросе совершенно ясна: мы не запрещаем использовать их в качестве инструмента написания статей. Главное, чтобы была ясность в том, как составляется статья и какое программное обеспечение используется. Нам нужна прозрачность, поскольку это лежит в основе того, как следует делать и распространять научные материалы <…> Мы как сообщество должны сосредоточиться на положительных аспектах использования и потенциале, а затем регулировать и сдерживать потенциальные злоупотребления. Я оптимистично настроена, и думаю, что нам удастся это сделать», — резюмировала Скиппер. Microsoft выпустила мини-ПК за $599 для разработчиков ARM-приложений для Windows
24.10.2022 [22:55],
Андрей Жученко
Microsoft начала продажи своей версии Mac Mini — компактного ПК за $599, который предназначен для разработчиков, создающих приложения для Windows 11 под платформу ARM. Устройство, ранее известное как Project Volterra, получило официальное название Windows Dev Kit 2023. ![]() Источник изображения: Microsoft Windows Dev Kit 2023 построен на платформе Qualcomm Snapdragon 8cx Gen 3, имеет 32 Гбайт оперативной памяти и оснащён 512-Гбайт твердотельным NVMe-накопителем. Устройство имеет два порта USB Type-C 3.2 Gen 2 сбоку и три USB Type-A 3.2 Gen 2 сзади, а также порт Ethernet и Mini DisplayPort. Главная особенность нового мини-ПК, это нейронный процессор (NPU), который позволит разработчикам задействовать алгоритмы искусственного интеллекта и машинного обучения с аппаратным ускорением. Похожий процессор установлен и в Surface Pro 9 с поддержкой 5G. Microsoft использует возможности NPU в Windows 11 для работы таких функций, как Voice Focus — алгоритма для удаления фонового шума, который не влияет на работу CPU или GPU. ![]() Windows Dev Kit 2023 может работать с несколькими дисплеями. Источник изображения: Microsoft Программное обеспечение является самой важной частью Windows Dev Kit 2023. Microsoft предлагает полный инструментарий нативных Arm-приложений для разработчиков. Visual Studio 2022 17.4 теперь работает нативно на Arm, с гораздо лучшей производительностью. Скорость работы .NET 7 для Arm также значительно улучшена. Разработчикам также предлагаются предварительные Arm-версии приложений Visual C++ и Windows App SDK. «Все больше приложений, инструментов и фреймворков переносятся для нативного использования Windows на Arm. И ещё большее их количество появится в ближайшее время, — объясняет Паван Давулури (Pavan Davuluri), менеджер команды CVP Windows Silicon and Systems Integration. — Благодаря мощной технологии эмуляции Windows 11, разработчики смогут запускать множество немодифицированных приложений и инструментов x64 и x86 прямо на своих Windows Dev Kit». Устройство также будет иметь доступ к Arm-версиям Microsoft Teams, Office, Edge и к облачному сервису OneDrive. Microsoft надеется, что выход нового Windows Dev Kit 2023 позволит значительно стимулировать разработку приложений для платформы Windows on Arm. Новый мини-ПК доступен к продаже с сегодняшнего дня в Австралии, Канаде, Китае, Франции, Германии, Японии, Великобритании и США. «Лаборатория Касперского» поддержала разработку российских нейроморфных чипов
20.06.2022 [05:51],
Сергей Карасёв
«Лаборатория Касперского» инвестировала в компанию «Мотив нейроморфные технологии» («Мотив НТ») — российского разработчика нейроморфных процессоров, предназначенных для аппаратного исполнения импульсных нейронных сетей. ![]() Источник изображений: pixabay.com Стартап «Мотив НТ», являющийся резидентом технопарка «Сколково», был основан в 2017 году. Компания также участвует в отраслевом союзе Нейронет. «Мотив НТ» развивает проект нейроморфного процессора «Алтай» для решения задач технического зрения и обработки сигналов в реальном времени. По сути, такие чипы имитируют работу человеческого мозга. «Традиционные вычислительные системы построены по архитектуре фон Неймана, где процессор и память разделены — это приводит к высокому энергопотреблению. Нейроморфная архитектура, разрабатываемая в проекте, лишена этого недостатка — память и обработчики расположены на одном чипе, что позволяет добиваться высокой производительности при очень низких энергозатратах», — заявляет «Мотив НТ». ![]() Как сообщает РБК, в результате подписанного соглашения «Лаборатория Касперского» получила 15-процентную долю в «Мотив НТ», выкупив по 7,5 % у двух сооснователей компании — Константина Панченко и Валерия Канглера. Сумма сделки не раскрывается, но, по мнению участников рынка, она могла составить несколько десятков миллионов рублей. Технологии «Мотив НТ» помогут «Лаборатории Касперского» в развитии собственных продуктов с элементами искусственного интеллекта. Кстати, «Лаборатория Касперского» ещё в 2019 году заключила соглашение о сотрудничестве с компанией «Мотив НТ». Российские учёные предложили новый вариант искусственных нейронов — электронный мозг на них будет на порядки лучше существующих
25.05.2022 [15:30],
Геннадий Детинич
Современные нейроморфные процессоры, производимые на основе классических КМОП-техпроцессов, сильно ограничены в возможностях имитировать мозг биологических существ. Проблема в том, что для работы каждого искусственного нейрона необходимо примерно 20 транзисторов, что ведёт к высокому потреблению энергии искусственными мозгами и к серьёзному тепловыделению. Российские учёные придумали, как решить эту проблему. ![]() Источник изображения: Nanomaterials «Лучшие на сегодня нейроморфные системы имитируют сети, состоящие примерно из одного миллиона нейронов и четверти миллиарда синапсов. Однако самые амбициозные биологические проекты ставят цели достичь 10 миллиардов нейронов и 100 триллионов синапсов. Стремление к такой высокой сложности требует решений на основе новых физических принципов передачи и обработки сигналов. Мы исследовали двух- и трёхпереходные сверхпроводящие квантовые интерферометры с джозефсоновскими контактами на основе золотых нанопроволок», — рассказал директор Центра перспективных методов мезофизики и нанотехнологий МФТИ Василий Столяров. Учёные из МФТИ и МГУ им. М. В. Ломоносова предложили для реализации сверхпроводящих аналогов нейронов решение с использованием нанопроводов из золота. Работа выполнена при поддержке Российского научного фонда, и завершилась она публикацией в журнале Nanomaterials. Учёные реализовали искусственный нейрон с помощью только двух джозефсоновских контактов. Это на порядок меньше, чем при использовании транзисторов в нейроморфных процессорах. К примеру, нейроморфный процессор Intel Loihi II представляет собой 1 млн искусственных нейронов и при этом содержит 2,3 млрд транзисторов (далеко не все из них идут на имитацию нейронов, но всё же). Джозефсоновский переход — это контакт двух сверхпроводников через слой диэлектрика. При переключении перехода происходит строго дозированный всплеск напряжения, форма которого близка к форме импульса в нейросети живого мозга. Пара таких переходов и нанопроволока из золота успешно имитируют работу одного нейрона и довольно экономично с точки зрения потребления энергии. Всё что необходимо для достижения нужного эффекта — это охладить массивы до криогенных температур вблизи абсолютного нуля. На основе подобных нейронов можно будет создавать массивы из нескольких миллиардов искусственных нейронов и удержаться в рамках разумного бюджета потребления. Тем самым искусственный мозг может вырасти в возможностях до мозга медведя (9,5 млрд нейронов) и жирафа (10,75 млрд нейронов), тогда как возможности процессора Intel Loihi II — это мозг насекомых. Более того, российские учёные разработали вариант искусственных нейронов, имитирующих работу в особых биологических условиях — под воздействием медикаментов или с повреждениями. Это придаст исследованиям новое направление, связанное с изучением деятельности мозга в нестандартных условиях. Николай Клёнов, доцент МГУ им. М. В. Ломоносова, добавляет: «Предлагаемый нейрон способен имитировать биологическую активность, соответствующую типичной реакции нейрона на обычную внешнюю стимуляцию, а также на допороговое раздражение. Кроме того, он имитирует режим травмы — биофизическую аномалию, вызванную различными нервными заболеваниями и повреждениями нейронов, и взрывной режим». Meta✴ рассказала о Project CAIRaoke — проекте по улучшению голосовых ассистентов на основе ИИ-технологий
24.02.2022 [14:00],
Владимир Фетисов
Разработчики из компании Meta✴ (в прошлом Facebook✴) рассказали о проекте Project CAIRaoke, в рамках которого была создана «сквозная нейронная модель», которая обеспечивает гораздо более естественный процесс взаимодействия человека с голосовым помощником. Новая модель уже используется в смарт-дисплеях Portal, а в будущем она станет частью устройств виртуальной и дополненной реальности, чтобы обеспечить наилучший опыт общения с виртуальными помощниками. ![]() Источник изображения: Meta✴ В сообщении сказано, что одним из главных препятствий на пути улучшения голосовых ассистентов является архитектура, на основе которой они построены. Несмотря на то, что такие системы выглядят как единое целое, они базируются на четырёх отдельных компонентах: понимание естественного языка (NLU), отслеживание состояния диалога (DST), управление политикой диалога (DP) и генерация естественного языка (NLG). Эти компоненты связаны между собой, из-за чего их оптимизация и адаптация к новым задачам трудна и во многом зависит от аннотированных наборов данных. Это одна из причин, по которым современные голосовые помощники держат пользователей в строго очерченных границах в процессе взаимодействия. В рамках Project CAIRaoke уже созданы нейронные модели, которые позволят людям более естественно и свободно общаться с голосовыми помощниками, например, возвращаясь к предыдущей теме разговора или полностью меняя её, упоминая вещи, зависящие от понимания нюансов контекста, и др. Пользователи также смогут взаимодействовать с голосовыми ассистентами новыми способами, например, с помощью жестов. В настоящее время новая модель используется в смарт-дисплеях Portal и находится на этапе раннего тестирования. Однако уже сейчас разработчики уверены в том, что она превосходит существующие подходы, используемые для создания голосовых помощников. Разработчики выразили уверенность в том, что достигнутый в рамках Project CAIRaoke прогресс позволит сделать более естественным общение между ИИ-алгоритмами и человеком, а также станет важным инструментом при создании метавселенной. Встроенный в AR-гарнитуру голосовой помощник в будущем станет более полезным и сможет понимать смысл того, что говорит пользователь естественным языком. В будущем подобные голосовые помощники могут появиться в разных приложениях, благодаря чему взаимодействовать с ними смогут люди по всему миру. Учёные придумали, как повысить эффективность ИИ — нужны нейросети с разными, а не одинаковыми искусственными нейронами
24.11.2021 [21:39],
Владимир Мироненко
Учёные Имперского колледжа Лондона подтвердили свою гипотезу о том, что использование разных видов искусственных нейронов (вычислительных блоков) при создании систем искусственного интеллекта (ИИ) повышает эффективность работы нейросетей. На эту идею учёных натолкнуло строение человеческого мозга и снежинки. ![]() Pixabay В природе не бывает двух одинаковых снежинок, как и одинаковых нейронов головного мозга млекопитающих. По мнению британских учёных, именно потому, что у искусственных сетей абсолютно одинаковые нейроны, человеческий мозг по-прежнему превосходит ИИ по многим параметрам — быстрее учится, адаптируется к меняющимся условиям, переключается с одной задачи на другую. Участвовавший в исследовании, результаты которого опубликованы в журнале Nature Communications, специалист по вычислительной нейробиологии Дэниел Гудман (Daniel Goodman), пояснил порталу NEO.LIFE разницу между способностью к обучению и адаптации к меняющимся обстоятельствам у человеческого мозга и ИИ. ИИ можно обучить, например, известной аркадной видеоигре Pong. «По краям поля движутся две ракетки, которые поочерёдно отбивают мячик. Обученный ИИ будет играть в эту игру идеально. Лучше, чем человек, — говорит Гудмен. — Однако стоит придвинуть ракетки хотя бы на пиксель ближе друг к другу, и ИИ не сможет играть в неё, так как он обучен только на конкретные параметры игры и не может справиться с любыми, даже самыми незначительными изменениями в ней». Такой проблемы у человека не существует, и причина, как считает ученый, кроется в том, что все нейроны головного мозга человека разные. Лаборатория интеллектуальных систем и сетей Имперского колледжа немного изменила каждую составляющую в нейросети, сделанной по образцу головного мозга, и это повысило эффективность и точность её работы на 20 %. Кроме того, учёные попытались как можно более точно воспроизвести импульсную работу сетей мозга, что также повысило эффективность нейросети: улучшились показатели работы ИИ по распознаванию речи, получению и интерпретации голосовых команд. Вдобавок изменение времени активации искусственных нейронов позволило повысить эффективность выполнения задач с временным компонентом, таких как распознание произносимых подряд цифр. В свою очередь, нейробиолог из лаборатории в Колд-Спринг-Харбор (штат Нью-Йорк, США) Парта Митра (Partha Mitra) считает, что дело скорее в том, как скомпонованы нейроны. И в зависимости от того, как выстроены нейроны (даже если они одинаковы), их можно использовать для решения разных задач. Митра и его британский коллега Гудмен считают, что в ближайшее время появятся пластичные системы ИИ, построенные на чипах с различными искусственными нейронами — нейроморфные системы. И благодаря пластичности, важной особенности естественных нейронных сетей, ИИ сможет научиться, например, безошибочно играть в Pong с изменяющимися параметрами, говорят учёные. |
✴ Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности». |