Сегодня 23 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Google анонсировала ИИ для корпоративных клиентов — он менее склонен фантазировать

Входящая в Google Cloud платформа Vertex AI, которая позволяет корпоративным клиентам создавать собственные службы с использованием машинного обучения и больших языковых моделей Google, получила новые возможности, направленные на предотвращение распространения неверной информации.

 Источник изображения: cloud.google.com

Источник изображения: cloud.google.com

В мае для всех клиентов была развёрнута функция Vertex AI Grounding with Google Search — она предоставляет моделям ИИ доступ к информации из интернета в реальном времени. Теперь же клиенты облачной платформы смогут дополнительно улучшить результаты своих сервисов ИИ с помощью специализированных сторонних наборов данных. Сервис будет пользоваться информацией от таких поставщиков как Moody’s, MSCI, Thomson Reuters и ZoomInfo, сообщила Google, и воспользоваться этой услугой компании смогут «в III квартале этого года». Это лишь одна разрабатываемых Google функций, призванных побудить организации начать развёртывание собственных корпоративных ИИ моделей в её инфраструктуре — все они направлены на снижение частоты недостоверных данных в ответах систем.

Ещё одна функция — «режим высокой точности», позволяющий организациям подключать к моделям собственные наборы данных вместо обширной базы знаний Google Gemini. Этот режим работает на основе спецверсии модели Gemini 1.5 Flash, и его можно подключить через раздел экспериментальных функций Vertex AI. Корпоративные клиенты также смогут осуществлять гибридный поиск, используя в качестве запросов образцы изображений и текстовые пояснения к ним. А в Grounding with Google Search вскоре будет доступен динамический поиск — система сможет автоматически выбирать источники информации: установленные наборы данных Gemini или Google Search, если предполагается частое обновление ресурсов.

Возможность контролировать наборы данных для ИИ-моделей Google поможет компании улучшить репутацию, которая пострадала после внедрения ИИ в поисковую систему. Если потребители с юмором восприняли советы есть камни и добавлять клей в пиццу, то корпоративным клиентам такие ошибки могут обойтись дорого.

Опытный разработчик чипов из Apple присоединился к стартапу Rain AI, который поддерживает Сэм Альтман

Один из основателей и генеральный директор OpenAI Сэм Альтман (Sam Altman) давно грезит выпуском собственных ускорителей вычислений, а потому поддерживает стартап Rain AI, обещающий разработать соответствующие чипы. Недавно штат этого стартапа обогатился опытным разработчиком, который помогал создавать Apple собственные процессоры, заменившие продукцию Intel.

 Источник изображения: Rain AI

Источник изображения: Rain AI

Речь идёт о Жане-Дидье Аллегруччи (Jean-Didier Allegrucci), который участвовал в разработке нескольких поколений собственных процессоров Apple и проработал в штате компании около семнадцати лет, а его общий стаж в отрасли превышает 30 лет. Недавно он был принят на работу в Rain AI, чтобы под руководством выходца из Meta Амина Фирузшахяна (Amin Firoozshahian) создать более энергоэффективные процессоры для ускорителей вычислений по сравнению с уже имеющимися аналогами конкурентов. Фирузшахян перешёл в Rain AI после пяти лет работы в Meta Platforms. Жан-Дидье Аллегруччи возглавит в Rain AI подразделение разработок аппаратного обеспечения.

Rain AI изучает возможность создания чипов, которые позволяли бы часть вычислений проводить на стороне микросхем памяти, подражая устройству головного мозга человека. Подобные разработки уже ведутся компаниями Intel, Samsung и TSMC, поэтому Rain AI не будет одинок в этой инициативе. По замыслу разработчиков, в конечном итоге более энергоэффективные чипы позволят распространить искусственный интеллект на большее количество устройств, и вычисления не нужно будет концентрировать в центрах обработки данных.

Новая модель OpenAI CriticGPT обучена «критиковать» результаты GPT-4

Компания OpenAI представила CriticGPT — новую модель искусственного интеллекта, предназначенную для выявления ошибок в коде, сгенерированном непосредственно ChatGPT. CriticGPT будет использоваться в качестве алгоритмического помощника для тестировщиков, которые проверяют программный код, выданный ChatGPT.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно новому исследованию «LLM Critics Help Catch LLM Bugs», опубликованному OpenAI, новая модель CriticGPT создана как ИИ-ассистент для экспертов-тестировщиков, проверяющих программный код, сгенерированный ChatGPT. CriticGPT, основанный на семействе большой языковой модели (LLM) GPT-4, анализирует код и указывает на потенциальные ошибки, облегчая специалистам обнаружение недочётов, которые в противном случае могли бы остаться незамеченными из-за человеческого фактора. Исследователи обучили CriticGPT на наборе данных с образцами кода, содержащими намеренно внесённые ошибки, научив его распознавать и отмечать различные погрешности.

Учёные обнаружили, что в 63-% случаев, связанных с естественно возникающими ошибками LLM, аннотаторы предпочитали критику CriticGPT человеческой. Кроме того, команды, использующие CriticGPT, писали более полные отзывы, чем люди, не использующие этого ИИ-помощника, при этом снижался уровень конфабуляций (ложных фактов и галлюцинаций).

Разработка автоматизированного «критика» включала обучение модели на большом количестве входных данных с намеренно внесёнными ошибками. Экспертов просили модифицировать код, написанный ChatGPT, внося ошибки, а затем предоставлять результат с якобы обнаруженными багами. Этот процесс позволил модели научиться выявлять и критиковать различные типы ошибок в коде.

В экспериментах CriticGPT продемонстрировал способность улавливать как внесённые баги, так и естественно возникающие ошибки в результатах ответов ChatGPT. Исследователи также создали новый метод «Force Sampling Beam Search» (FSBS), который помогает CriticGPT писать более детальные обзоры кода, позволяя регулировать тщательность поиска проблем и одновременно контролируя частоту ложных срабатываний.

Интересно, что возможности CriticGPT выходят за рамки простой проверки кода. В экспериментах модель применили к множеству тренировочных данных ChatGPT, ранее оцененных людьми как безупречные. Удивительно, но CriticGPT выявил ошибки в 24-% случаев, которые впоследствии были подтверждены экспертами. OpenAI считает, что это демонстрирует потенциал модели не только для работы с техническими задачами, но и подчёркивает её способность улавливать тонкие ошибки, которые могут ускользнуть даже от тщательной проверки человеком.

Несмотря на многообещающие результаты, CriticGPT, как и все ИИ-модели, имеет ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может не полностью подготовить её к оценке более длинных и сложных задач, с которыми могут столкнуться будущие ИИ-системы. Команда исследователей признаёт, что модель наиболее эффективна в обнаружении ошибок, которые могут быть определены в одном конкретном, узком месте кода. Однако реальные ошибки в выводе AI могут часто быть разбросаны по нескольким частям ответа, что представляет собой вызов для будущих итераций модели.

Кроме того, хотя CriticGPT снижает уровень конфабуляций, он не устраняет их полностью, и люди-эксперты по-прежнему могут совершать ошибки на основе этих ложных данных.

Instagram✴ позволил некоторым авторам создавать ИИ-версии самих себя — в будущем такую возможность могут получить все

Генеральный директор Meta Марк Цукерберг (Mark Zuckerberg) объявил, что компания начинает тестирование ИИ-аватаров в Instagram, созданных пользователями с помощью инструмента Meta AI Studio. Первоначально ИИ-аватары будут отображаться в основном в сообщениях и будут обозначены ярлыком «AI».

 Источник изображения: ***

Источник изображения: Meta

В рамках теста в ближайшие недели подписчики известных каналов смогут пообщаться со своими кумирами через их ИИ-аватары, которые фактически являются ИИ-чат-ботами. Отмечается, что в будущем любой пользователь или компания сможет создать на платформе собственного чат-бота для взаимодействия со своим сообществом и клиентами.

Эта инновационная функция поможет не оставить без внимания ни одного сообщения от поклонников, тогда как физически отвечать на все входящие сообщения просто невозможно. Со временем такие ИИ-персонажи станут более совершенными и даже могут стать своего рода искусством, считает Цукерберг.

Изначально в тестировании примут участие примерно 50 создателей контента и небольшой процент обычных пользователей. Затем Meta развернёт эту функцию для большего количества людей в течение следующих нескольких месяцев, что произойдёт примерно в августе.

Цукерберг подчеркнул, что это не просто расширение функционала, это новый уровень взаимодействия, позволяющий установить более тесную связь с аудиторией и клиентами через персонализированных чат-ботов на базе искусственного интеллекта. Конечной целью является разработка различных API-интерфейсов, отражающих разнообразие интересов людей, и возможность адаптировать ИИ-аватары под личные нужды.

YouTube пытается договориться со звукозаписывающими лейблами об ИИ-клонировании голосов артистов

После дебюта в прошлом году инструментов генеративного ИИ, создающих музыку в стиле множества известных исполнителей, YouTube приняла решение платить Universal Music Group (UMG), Sony Music Entertainment и Warner Records паушальные взносы в обмен на лицензирование их песен для легального обучения своих инструментов ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

YouTube сообщила, что не планирует расширять возможности инструмента Dream Track, который на этапе тестирования поддерживали всего десять артистов, но подтвердила, что «ведёт переговоры с лейблами о других экспериментах». Платформа стремится лицензировать музыку исполнителей для обучения новых инструментов ИИ, которые YouTube планирует запустить позднее в этом году. Суммы, которые YouTube готова платить за лицензии, не разглашаются, но, скорее всего, это будут разовые (паушальные) платежи, а не соглашения, основанные на роялти.

Информация о намерениях YouTube появились всего через несколько дней после того, как Ассоциация звукозаписывающей индустрии Америки (RIAA), представляющая такие звукозаписывающие компании, как Sony, Warner и Universal, подала отдельные иски о нарушении авторских прав против Suno и Udio — двух ведущих компаний в области создания музыки с использованием ИИ. По мнению RIAA, их продукция произведена с использованием «нелицензионного копирования звукозаписей в массовом масштабе». Ассоциация требует возмещения ущерба в размере до $150 000 за каждое нарушение.

Недавно Sony Music предостерегла компании, занимающиеся ИИ, от «несанкционированного использования» её контента, а UMG была готова временно заблокировать весь свой музыкальный каталог в TikTok. Более 200 музыкантов в открытом письме призвали технологические компании прекратить использовать ИИ для «ущемления и обесценивания прав занимающихся творчеством людей».

Opera выпустила предварительную версию браузера One R2 с разделением экрана, ИИ-функциями и другими новшествами

Opera выпустила предварительную версию R2 своего флагманского браузера Opera One. Она доступна для загрузки на канале для разработчиков, предлагая пользователям протестировать такие функции как улучшенное управление мультимедиа, разделение экрана, новые возможности встроенного искусственного интеллекта и многое другое.

 Источник изображений: opera.com

Источник изображений: opera.com

Заметным нововведением Opera One R2 стали переработанные элементы управления мультимедиа, которые позволяют быстро приостанавливать и возобновлять произведение, почти не отвлекаясь от работы — достаточно просто навести курсор мыши на боковую панель, не переключаясь с текущей вкладки. Браузер может автоматически приостанавливать и возобновлять воспроизведение при запуске видео или поступлении входящего вызова. Плавающее окно «картинка в картинке» позволяет ставить воспроизведение на паузу, переходить к предыдущему и следующему пунктам воспроизведения, быстро отключать звук и выполнять другие действия.

В будущей версии Opera One R2 появятся темы, созданные ИИ с настраиваемыми динамическими фонами и звуковыми эффектами. В текущей же расширились возможности встроенной системы ИИ Aria: она поддерживает генерацию изображений, позволяет составлять запросы с загрузкой изображений, а также может зачитывать свои ответы вслух. Появился режим контекста страницы — это значит, что ИИ может подготовить сводку контента на открытой странице, предложить перевод и другие операции.

В браузере появился режим разделённого экрана, то есть в одном окне можно расположить две страницы — для этого достаточно перенести одну из вкладок в нужную сторону. Тем, кто любит держать открытыми большое число вкладок, понравится функция их «следов» — заголовки недавно просмотренных вкладок подчёркиваются тонкой линией. А для дополнительной персонализации можно назначить каждой вкладке свой смайлик. Opera One R2 доступна для скачивания на канале для разработчиков — можно загрузить версии для Windows, macOS и Linux. Общедоступная версия запланирована к выходу в этом году.

Зонд «Юнона» показал крупным планом вулканы и лавовые озёра спутника Юпитера Ио

Ценным инструментом для изучения спутника Юпитера Ио стал итальянский инфракрасный прибор Juno Jovian Infrared Auroral Mapper (JIRAM) на зонде «Юнона». Ио — это самое вулканически активное тело в Солнечной системе с сотнями вулканов. Близкие пролёты «Юноны» рядом с ним позволяют крупным планом увидеть лавовые озёра и изучить их общее строение, что даёт представление о процессах в недрах этой юпитерианской луны.

 Источник изображений: NASA/JPL-Caltech

Шлейфы вулканических выбросов на Ио. Источник изображений: NASA/JPL-Caltech

Учёные только начинают разбирать данные, полученные после близких пролётов зонда NASA мимо Ио в прошлом году. Впрочем, научный анализ не терпит суеты. Первая работа по этим данным была опубликована несколько дней назад в журнале Nature. Прибор JIRAM разрабатывался для изучения атмосферы Юпитера на глубину до 70 км ниже облачного покрова планеты-гиганта. Но он также стал прекрасным инструментом для изучения лун Юпитера, самой поразительной из которых считается Ио.

Исходя из данных JIRAM по обнаруженным на Ио лавовым озёрам, эти образования на спутнике множественные и достаточно локальные. Магма не переливается через края кальдеры, из чего учёные делают выводы о достаточно высоких — до нескольких сотен метров — стенах кратеров.

 Лавовое озеро, обнаруженное прибором JIRAM

Лавовое озеро, обнаруженное прибором JIRAM

Интересной и не до конца понятной особенностью лавовых озёр Ио стало отчётливое отсутствие застывшей магматической корки по их краям. Это указывает на вероятную циркуляцию магмы от центра в края и вглубь кратеров, либо на такие условия по краям, при которых застывшая корка обламывается с краю и обнажает лавовое кольцо. Это даёт некоторые подсказки о поведении магмы в недрах Ио, но для окончательного вывода их недостаточно.

Учёные продолжают получать данные по Ио. «Юнона» совершила 62-й облёт Юпитера 13 июня. Она прошла над луной на высоте 29 250 км. Свой 63-й облёт Юпитера и Ио зонд совершит 16 июля. Аппарат получил возможность прохода над северным и южным полюсами спутника, что позволит впервые получить данные о вулканической активности Ио в приполярных областях.

Вышла первая реклама, созданная ИИ-генератором видео OpenAI Sora

Занимавшаяся производством игрушек компания Toys "R" Us объявила о банкротстве в 2017 году, но её бренд лицензировала WHP Global, и продукция под этой маркой продолжает поступать в магазины. Теперь же для поддержки бренда был создан рекламный ролик, и значительную часть работы проделал основанный на искусственном интеллекте генератор видео OpenAI Sora.

Источник изображения: Toys

Источник изображения: Toys "R" Us

Разработка видео была поручена креативному агентству Native Foreign. В проекте были задействованы «около десятка человек», сообщил режиссёр Ник Клеверов (Nik Kleverov). Модель ИИ Sora, по его словам, проделала 80–85 % работы, а коллектив взял на себя «корректирующие визуальные эффекты». Полная версия «брендового фильма», как назвали в Toys "R" Us эту работу, ещё не опубликована, но её показали на фестивале «Каннские львы», который прошёл во Франции на минувшей неделе. Тизерный ролик опубликован на YouTube-канале бренда.

 Исходная (сверху) и финальная (снизу) версия кадра с грамматической ошибкой на вывеске. Источник изображения: x.com/kleverov

Исходная (сверху) и финальная (снизу) версия кадра с грамматической ошибкой на вывеске. Источник изображения: x.com/kleverov

Участие человека для подготовки финальной версии ролика действительно было необходимым. Режиссёр опубликовал (а потом удалил) в соцсети X небольшой отчёт о том, как создавалось видео, и на одном из кадров показалась написанная с грамматической ошибкой вывеска, которую пришлось исправить. Полную версию «брендового фильма» обещают опубликовать на сайте Toys "R" Us.

Учёные нашли способ запускать большие ИИ-модели на системах мощностью 13 Вт, вместо 700 Вт

Исследователи из Калифорнийского университета в Санта-Круз разработали метод, позволяющий запускать большие языковые модели искусственного интеллекта (LLM) с миллиардами параметров при значительно меньшем потреблении энергии, чем у современных систем.

 Источник изображения: Stefan Steinbauer/Unsplash

Источник изображения: Stefan Steinbauer/Unsplash

Новый метод позволил запустить LLV с миллиардами параметров при энергопотреблении системы всего в 13 Вт, что эквивалентно потреблению бытовой светодиодной лампы. Это достижение особенно впечатляет на фоне текущих показателей энергопотребления ИИ-ускорителей. Современные графические процессоры для центров обработки данных, такие как Nvidia H100 и H200, потребляют около 700 Вт, а грядущий Blackwell B200 вообще может использовать до 1200 Вт на один GPU. Таким образом, новый метод оказывается в 50 раз эффективнее популярных сегодня решений, пишет Tom's Hardware.

Ключом к успеху стало устранение матричного умножения (MatMul) из процессов обучения. Исследователи применили два метода. Первый — это перевод системы счисления в троичную, использующую значения -1, 0 и 1, что позволило заменить умножение на простое суммирование чисел. Второй метод основан на внедрении временных вычислений, при котором сеть получила эффективную «память», позволившую работать быстрее, но с меньшим количеством выполняемых операций. Работа проводилась на специализированной системе с FPGA, но исследователи подчёркивают, что большинство их методов повышения эффективности можно применить с помощью открытого программного обеспечения и настройки уже существующих на сегодня систем.

Исследование было вдохновлено работой Microsoft по использованию троичных чисел в нейронных сетях, а в качестве эталонной большой модели учёные использовали LLaMa от Meta. Рюдзи Чжу (Rui-Jie Zhu), один из аспирантов, работавших над проектом, объяснил суть достижения в замене дорогостоящих операций на более дешёвые. Хотя пока неясно, можно ли применить этот подход ко всем системам в области ИИ и языковых моделей в качестве универсального, потенциально он может радикально изменить ландшафт ИИ.

Немаловажно, что учёные открыли исходный код своей разработки, что позволит крупным игрокам рынка ИИ, таким как Meta, OpenAI, Google, Nvidia и другим беспрепятственно воспользоваться новым достижением для обработки рабочих нагрузок и создания более быстрых и энергоэффективных систем искусственного интеллекта. В конечном итоге это приведёт к тому, что ИИ сможет полнофункционально работать на персональных компьютерах и мобильных устройствах, и приблизится к уровню функциональности человеческого мозга.

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

В коде ИИ-гаджета Rabbit R1 обнаружена ошибка, которая открывает доступ к личным данным пользователей

Группа энтузиастов Rabbitude, занимающаяся обратным проектированием ИИ-устройства Rabbit R1, обнаружила связанную с безопасностью проблему в его коде, из-за которой конфиденциальная информация пользователей гаджета может оказаться общедоступной.

 Источник изображения: rabbit.tech

Источник изображения: rabbit.tech

Энтузиасты Rabbitude сообщили, что 16 мая им удалось получить доступ к кодовой базе Rabbit, в которой они обнаружили «несколько критических жёстко запрограммированных ключей API». Доступ к этим ключам даёт любому желающему возможность прочитать любой ответ, который когда-либо давало устройство R1, включая ответы, которые содержат личную информацию пользователей. Эти данные также можно использовать для блокировки устройств, изменения их ответов и подмены голоса.

Обнаруженные энтузиастами ключи API открывают доступ к службе преобразования текста в речь ElevenLabs, системе преобразования речи в текст Azure, службе поиска отзывов Yelp, а также картографическому сервису «Google Карты». Один из участников проекта Rabbitude заявил, что компании было известно о проблеме с мая, и она «ничего не сделала, чтобы её исправить». После предания проблемы огласке, говорят энтузиасты, Rabbit отозвала ключ API ElevenLabs, из-за чего устройства R1 на некоторое время не могли работать должным образом.

В Rabbit заявили ресурсу Engadget, что узнали о «предполагаемой утечке данных» лишь 25 июня. «Наш отдел безопасности немедленно начал расследование. На данный момент нам не известно об утечке каких-либо данных клиентов или какой-либо компрометации наших систем. Если мы узнаем о какой-либо другой соответствующей информации, мы сообщим, как только у нас появятся более подробные сведения», — добавили в компании. Об отзыве обнаруженных Rabbitude ключей API производитель не сообщил.

Rabbit R1 — основанное на ИИ устройство-помощник, упрощающее пользователю решение таких задач как заказ еды, поиск информации в интернете или запрос прогноза погоды. После выхода в продажу за $199 гаджет получил низкие оценки в обзорах, потому что обещанные производителем функции часто не работали — и вообще, они преимущественно умещаются в одном приложении для Android, а значит, при наличии смартфона необходимости в этом гаджете нет.

OpenAI отложила запуск голосового помощника, чтобы он не наговорил лишнего

OpenAI отложила запуск долгожданной функции голосового помощника ChatGPT в стремлении гарантировать, что он сможет безопасно и эффективно обрабатывать запросы миллионов пользователей. Первоначально запуск функции намечался на конец июня — теперь его перенесли примерно на месяц.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Голосовой интерфейс чат-бота OpenAI анонсировала в мае на мероприятии, посвящённом обновлённой модели искусственного интеллекта GPT-4o, которая более эффективно обрабатывает текст, звук и изображения в реальном времени. Компания сообщила, что первоначально рассчитывала запустить голосового помощника для небольшого числа подписчиков ChatGPT Plus, но приняла решение потратить ещё месяц, чтобы «достичь нашей планки для запуска».

«Мы совершенствуем способность модели обнаруживать и отклонять определённый контент. Мы также работаем над повышением качества работы системы и готовим инфраструктуру к масштабированию для обеспечения выдачи ответов в реальном времени», — сообщила OpenAI. Это не самое приятное решение для компании, которая стремится сохранить лидерство в жёсткой конкурентной среде.

Всем платным подписчикам голосовой помощник, согласно плану, должен стать доступным осенью. OpenAI также рассказала, что готовится развернуть для чат-бота поддержку видео и трансляции экрана — более подробно об этих функциях она пообещала рассказать позже. В результате с выходом голосового помощника его возможности будут ограничены в сравнении с версией, которую компания демонстрировала на презентации в мае. К примеру, не будет работать функция компьютерного зрения, которая помогла ИИ консультировать пользователя по танцевальным движениям.

Honor представила ИИ-технологии для обнаружения дипфейков и защиты от развития близорукости

На проходящей в Шанхае выставке Mobile World Congress Shanghai (MWC Shanghai) компания Honor представила две основанные на искусственном интеллекте технологии для устройств: AI Defocus Eye Protection (защита глаз от расфокусировки) и AI Deepfake Detection (обнаружение дипфейков).

 Источник изображения: Brian Penny / pixabay.com

Источник изображения: Brian Penny / pixabay.com

Технология Honor AI Defocus Eye Protection имитирует очки расфокусировки на экране устройства. Такие очки создают контролируемую расфокусировку в периферийном зрении пользователя, помогая удерживать взгляд на экране устройства — формируется искажённое зрительное восприятие, из-за которого снижается риск развития близорукости. Эта технология помогает уменьшить эффект временного возникновения близорукости в среднем на 13° в течение 25 минут после чтения, утверждает Honor, а в некоторых случаях снижение достигает 75°.

 Источник изображения: Honor

Источник изображения: Honor

Honor AI Deepfake Detection помогает предотвращать случаи мошенничества, обнаруживая контент, который подвергался цифровым манипуляциям. Это делается посредством покадрового анализа изображения во время видеосвязи по таким критериям как зрительный контакт, чёткость изображения, эффекты освещения и воспроизведения видео — так выявляются недостатки, невидимые человеческому глазу.

 Источник изображения: Honor

Источник изображения: Honor

Лежащая в основе технологии нейросеть обучена на большом объёме данных и видео, связанных с мошенничеством онлайн, благодаря чему система осуществляет идентификацию, проверку и сравнение всего за три секунды. Если обнаруживается подделка, пользователю выводится предупреждение о риске мошеннических действий, чтобы удержать его от дальнейшего контакта с возможным злоумышленником.

AMD на следующей неделе представит технологию сжатия текстур с помощью нейросети

На следующей неделе компания AMD представит метод компрессии текстур с использованием нейронной сети. Он обещает значительно снизить объёмы загружаемых игровых данных. Проще говоря, технология позволит играм занимать меньше места на накопителе, а также задействовать меньше видеопамяти для текстур высокого разрешения без снижения качества изображения.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

В прошлом году подобную технологию представили разработчики компании Nvidia. Она получила название «Нейронное сжатие текстур материалов с произвольным доступом» (NTC). По словам Nvidia, NTC обеспечивает в 4 раза более высокое разрешение (в 16 раз больше текселей), чем традиционное блочное сжатие с помощью графического процессора, доступное во многих форматах.

AMD работает над аналогичной технологией. Компания 2 июля проведёт презентацию под названием «Нейронное блоковое сжатие текстур». О новом методе сжатия текстур расскажут представители AMD Шин Фудзиеда (Shin Fujieda) и Такахиро Харада (Takahiro Harada). «Мы расскажем о “Нейронном блоковом сжатии текстур” на EGSR2024 в Лондоне. Никому не нравится скачивать огромные игровые пакеты. Наш метод сжимает текстуры при помощи нейронной сети и сокращает объём загружаемых данных. Среда выполнения при этом не изменена, поэтому метод легко интегрировать в игры», — говорится в заявлении, опубликованном на официальной странице AMD GPUOpen в соцсети X.

На данный момент непонятно, предполагает ли метод компрессии текстур от AMD имплементацию на уровне драйвера или он требует поддержки со стороны разработчиков самих игр. Кроме того, неизвестно, какие аппаратные требования будут у данного метода сжатия.

Аналогичный метод компрессии текстур от Nvidia пока не был реализован ни в одной игре. Хотя AMD и обещает лёгкую интеграцию с играми своего метода, это не гарантирует его массового использования. Однако открытый исходный код технологии или её интеграция в программный пакет FidelityFX, вероятно, сделают её более привлекательной для разработчиков.

Роль нейронных сетей в играх значительно вырастет в будущем. Недавно, глава Nvidia Дженсен Хуанг (Jensen Huang) намекнул, что компания может сосредоточить своё внимание на повышении качества текстур с помощью ИИ, который будет генерировать объекты в высоком разрешении в играх.

Google позволит создавать кастомных чат-ботов для индивидуального общения — в том числе, на основе знаменитостей и блогеров

Google разрабатывает технологию создания персонализированных чат-ботов, с которыми можно общаться как с реальными людьми или вымышленными персонажами. Пользователи смогут создавать собственных ботов, настраивая их стиль общения и характер.

 Источник изображения: Google

Источник изображения: Google

По данным The Information, подразделение Google Labs разрабатывает продукт для создания и общения с настраиваемыми чат-ботами, которые могут быть смоделированы на основе знаменитостей или созданы непосредственно самими пользователями. Чат-боты будут построены на основе моделей Gemini и позволят задавать их индивидуальную личность, а также внешний вид виртуального собеседника. Google рассматривает возможность официального сотрудничества с инфлюенсерами для создания ботов на их основе.

Учитывая возможности ИИ-моделей по работе с большими объёмами данных, проект отлично впишется в концепцию Google Labs и может быть запущен уже в этом году в качестве отдельного продукта. В перспективе планируется интегрировать этот продукт в YouTube, что даст пользователям возможность общаться с персонализированными чат-ботами прямо на платформе видеохостинга. Это будет эксперимент, который уже предлагает Meta в Instagram, правда, не вызывая пока особого интереса со стороны пользователей.

Отметим, что новый проект отличается от проекта Gems, который является просто кастомизированной версией Gemini для определённых нужд. Например, в Gemini Gems по умолчанию будет тренер по йоге, репетитор по математике и кулинарный гуру. А чтобы создать собственного личного помощника, придётся купить подписку Gemini Advanced. Gems был анонсирован на конференции Google I/O 2024 в мае и станет доступен широкой аудитории в ближайшее время.


window-new
Soft
Hard
Тренды 🔥
Исполнитель роли Тревора в GTA V оказался равнодушен к GTA VI и призвал геймеров читать Достоевского 18 мин.
«Яндекс» поселил «Алису» на флагманском ИИ в мессенджерах Max и Telegram 29 мин.
Intel признала устаревшей встроенную графику Tiger Lake, Rocket Lake, Alder Lake и Raptor Lake — драйверы будут выходить реже 55 мин.
Кодзима показал первый постер шпионского боевика Physint в духе Metal Gear и анонсировал ещё одну экранизацию Death Stranding 2 ч.
Google снова попытаются разорвать на части — Минюст США потребовал отделения рекламного бизнеса 2 ч.
Производитель Peugeot, Opel и Fiat заявил об утечке данных клиентов после хакерской атаки 3 ч.
Крупнейшие корпорации заливают миллиарды в ИИ, даже не понимая, зачем им это нужно 4 ч.
Трамп на этой неделе объявит, что сделка по TikTok соответствует требованиям закона, но не получит «золотую акцию» 5 ч.
Perplexity запустила ИИ-агента для электронной почты — он будет копаться в Outlook и Gmail за $200 в месяц 15 ч.
Комедийное приключение The Dungeon Experience от автора Paradigm заручилось поддержкой Devolver Digital и получило демоверсию в Steam 16 ч.
Красный флаг для «красной» компании — Moody's раскритиковало эпохальный план Oracle по созданию ИИ ЦОД 2 мин.
Мечта Маска забуксовала: роботакси Tesla в Калифорнии будут вовсе не беспилотными и не совсем такси 30 мин.
Huawei собралась за три года догнать Nvidia в сфере ИИ, завалив рынок ускорителями Ascend и не только 33 мин.
SoftBank, Meta и др. проложат между Японией и Сингапуром подводный интернет-кабель Candle длиной 8 тыс. км 59 мин.
Dreame открыл в Москве флагманский магазин нового формата 2 ч.
Учёные укротили свет в алмазах для прорыва в квантовых технологиях 2 ч.
К ИИ готов: одобрен проект первого в России ЦОД гиперскейл-класса 3 ч.
Relativity Networks и британская Network Planning Solutions займутся коммерческим внедрением полого оптоволокна 5 ч.
Дженсен Хуанг: сделка с OpenAI не навредит другим клиентам Nvidia 7 ч.
Совместный проект Nvidia и OpenAI потребует энергию 10 ядерных реакторов 9 ч.