Сегодня 08 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Google добавит в рекламу 3D-модели и виртуальную примерку одежды с помощью ИИ

Google продолжает добавлять в свою поисковую систему технологии на базе искусственного интеллекта. На этой неделе компания анонсировала появление рекламы в генерируемых ИИ сводках ответов на введённый запрос. В дополнение к этому Google предложила рекламодателям возможность создавать 3D-модели своих товаров, а продавцам одежды — показывать, как тот или иной элемент гардероба смотрится на людях разной комплекции и цвета кожи. Всё это тоже построено на ИИ.

 Источник изображений: Pixabay

Источник изображений: Pixabay

Google планирует облегчить процесс онлайн-шопинга, сделав более наглядным процесс демонстрации одежды в рекламных объявлениях. Рекламодатель сможет получить десятки разных моделей без необходимости делать фотографии с реальными людьми. На начальном этапе эта функция будет доступна продавцам женских и мужских рубашек, другие типы одежды пока не поддерживаются.

Новый формат рекламы является логическим продолжением бесплатного инструмента виртуальной примерки одежды, который Google сделала доступным для рекламодателей в прошлом году. Новый алгоритм объединяет изображения товаров продавцов с существующими фотографиями моделей и является одним из первых примеров того, как Google адаптирует собственные генеративные нейросети для своего основного бизнеса, связанного с онлайн-рекламой. Ожидается, что новая генеративная функция сделает для покупателей проще процесс поиска подходящей одежды, поскольку они смогут увидеть, как она сидит на человеке схожей комплекции и цвета кожи.

В дополнение к этому рекламодатели смогут генерировать 3D-модели своих товаров из нескольких фото. К примеру, достаточно сделать снимки кроссовок с разных сторон и загрузить их в сервис Google, чтобы получить трёхмерную модель обуви, которую можно добавить в рекламное объявление. Ещё ретейлеры смогут генерировать совершенно новые изображения товаров на основе снимков из прошлых рекламных кампаний.

В дальнейшем Google намерена улучшать ИИ-алгоритмы и добавлять новые функции для рекламодателей. Компания пытается упростить процесс создания привлекательных изображений для маркетинговых кампаний без необходимости траты средств и времени на графических дизайнеров, фотографов и моделей. Очевидно, что в будущем количество сгенерированной ИИ рекламы в интернете будет только расти.

Провал заменителя смартфона AI Pin вынудил стартап Humane выставить себя на продажу

Похоже, заменитель смартфона AI Pin не смог совершить революцию не снискал огромной популярности — разработавший его стартап Humane занялся поисками потенциального покупателя своего бизнеса. Поиски начались вскоре после появления первых обзоров новинки с нелицеприятной критикой её ограниченных возможностей, сообщил Bloomberg со ссылкой на информированные источники.

 Источник изображений: humane.com

Источник изображений: humane.com

По словам одного из источников, Humane обратилась за помощью к финансовому консультанту. Компания рассматривает возможность продажи бизнеса за сумму в пределах от $750 млн до $1 млрд. Процесс всё ещё находится на ранней стадии, поэтому нет никаких гарантий, что он приведёт к какой-либо сделке.

Устройство AI Pin вызвало большой интерес у пользователей, однако после выхода подверглось резкой критике со стороны экспертов и потребителей из-за проблем с его надёжностью и практичностью. Компания сообщила, что работает над устранением таких недостатков, как небольшая продолжительность автономной работы, перегрев устройства, точность ответов и время отклика.

В настоящее время Humane привлекла порядка $230 млн от ряда крупных инвесторов, включая генерального директора OpenAI Сэма Альтмана (Sam Altman). В конце прошлого года её стоимость оценивалась в $800 млн.

Поиски Humane потенциального покупателя происходит в то время, когда её конкуренты укрепляют позиции на рынке устройств с ИИ. В частности, Meta✴ Platforms совершенствует очки Ray-Ban с искусственным интеллектом, а стартап Rabbit предлагает портативное устройство Rabbit R1, которое управляет приложениями с помощью ИИ вместо пользователя. Но пока ни одна из технологий не нашла широкого применения и не завоевала большой популярности.

Microsoft представила платформу Windows Copilot Runtime для разработки Windows-приложений с ИИ

Ключевой особенностью представленной Microsoft концепции компьютеров Copilot Plus PC являются новые функции на основе искусственного интеллекта, интегрированные непосредственно в Windows 11. В реальности работу платформы ИИ на Windows 11 обеспечивают более 40 моделей ИИ, доступ к которым разработчикам приложений открывается через специальную среду выполнения — Windows Copilot Runtime, о которой Microsoft подробно рассказала на конференции Build.

 Источник изображения: Windows / unsplash.com

Источник изображения: Windows / unsplash.com

Среда выполнения Windows Copilot Runtime включает в себя библиотеку API, которые разработчики могут использовать в своих приложениях; а также платформы ИИ и цепочки инструментов для новых моделей на устройствах под Windows. «Библиотека Windows Copilot состоит из готовых к использованию API ИИ, таких как Studio Effects, Live Captions Translations, OCR, Recall with User Activity и Phi Silica, которые будут доступны разработчикам в июне», — пояснил глава подразделения Windows and Surface Паван Давулури (Pavan Davuluri).

Разработчики смогут подключать библиотеку Windows Copilot для интеграции в приложения возможностей пакета Studio Effects, включая фильтры и размытие. К примеру, Meta✴ добавила эти функции в клиент WhatsApp — в видеозвонках появятся размытие фона и зрительный контакт. Функциями перевода и Live Captions разработчики смогут пользоваться либо вообще без кода, либо с его минимальным присутствием.

 Источник изображения: blogs.windows.com

Источник изображения: blogs.windows.com

Ранее Microsoft анонсировала функцию Recall, благодаря которой компьютеры Copilot Plus получили возможность сохранять все действия пользователей на компьютере с возможностью последующего поиска. Разработчики смогут подключать свои приложения и к этой функции — пользователи смогут продолжать работу с программой с того места, где они остановились в прошлый раз. В Microsoft считают, что эти функции, для работы которых необходимы ИИ-ускорители Arm-процессоров, а также чипов AMD и Intel, запустят целую волну приложений с ИИ в ближайшее десятилетие.

Microsoft Copilot дорос до виртуального сотрудника — ИИ-помощник будет самостоятельно выполнять простые рабочие задачи

Вскоре Microsoft предложит предприятиям и разработчикам возможность использовать помощника на базе искусственного интеллекта Copilot в качестве виртуального сотрудника для рутинных рабочих задач. Вместо того, чтобы функционировать только в режиме чат-бота, Copilot станет выполнять мониторинг почтовых ящиков, сможет автоматизировать ряд задач и осуществлять ввод данных — сегодня всё это работникам компаний приходится выполнять вручную.

 Источник изображений: microsoft.com

Источник изображений: microsoft.com

«Мы очень быстро поняли, что работа Copilot только в формате общения сегодня крайне ограничивает его возможности. Вместо того, чтобы Copilot ждал, пока с ним кто-нибудь поговорит, что если его могли бы сделать более активным и дали ему возможность работать в фоновом режиме над задачами автоматизации?» — пояснил инициативу ресурсу The Verge корпоративный вице-президент Microsoft по бизнес-приложениям и платформам Чарльз Ламанна (Charles Lamanna). Пока новые возможности Copilot открылись лишь небольшой группе участников программы тестирования, но уже в этом году они появятся в общедоступной предварительной версии Copilot Studio.

Компании смогут создавать агентов Copilot, способных брать на себя функции службы техподдержки, адаптации сотрудников и многое другое. Такие агенты будут запускаться при определённых событиях и работать с собственными данными компании. Вот как описывает механизм его работы сама Microsoft: «Представьте, что вы — новый сотрудник. Проактивный Copilot приветствует вас, анализирует информацию из отдела кадров и отвечает на ваши вопросы, знакомит вас с напарником, обучает и определяет сроки, помогает с формами и организует встречи на первую неделю. Теперь кадровики и [другие] сотрудники смогут выполнять свои обычные задачи без хлопот с администрированием».

Такие механизмы автоматизации, конечно, вызывают вопросы о потере рабочих мест людьми и опасения по поводу того, как ИИ будет развиваться дальше. Господин Ламанна подчёркивает, что агенты Copilot смогут избавить человека от повторяющихся и однообразных задач, таких как ввод данных, а полностью подменять собой человека они не будут. Другими словами, Microsoft, по собственному утверждению компании, стремится избавить сотрудников от скучных монотонных заданий. С учётом постоянной борьбы между техногигантами за доминирование в сфере ИИ создаётся впечатление, что одной автоматизацией дело не ограничится. Но, отмечает Ламанна, важными составляющими рабочего процесса остаются человеческие мнение и сотрудничество, и автоматизировать можно не всё.

Microsoft также сообщила, что оградила Copilot от потенциальных сбоев, таких как галлюцинации ИИ, встроив в Copilot Studio элементы управления. Это значит, что агент ИИ должен действовать в рамках того, что было определено в рамках инструкций и операций, связанных с автоматизацией задач. Упростились и механизмы переноса данных в локальный экземпляр Copilot — с общедоступных веб-сайтов, а также SharePoint, OneDrive и прочих ресурсов. Если в 2023 году основными задачами Copilot были поиск данных и составление сводок пользовательского контента, то в этом году основным направлением деятельности Microsoft в области ИИ становится кастомизация. Прежде Copilot был сосредоточен на индивидуальном взаимодействии с человеком, а сейчас он будет больше работать с группами пользователей. В этом году обновятся возможности Team Copilot для корпоративного мессенджера Microsoft — ИИ сможет управлять повестками дня во время встреч и заметками, модерировать чаты подразделений, помогать ставить задачи и отслеживать сроки в Microsoft Planner.

Nvidia втрое ускорила работу ИИ на видеокартах GeForce RTX

Nvidia сообщила, что дополнительно увеличила ИИ-производительность своих видеокарт GeForce RTX и платформ RTX AI PC с выпуском последнего драйвера версии GeForce Game Ready 555.85 WHQL. В ходе конференции Microsoft Build компания Nvidia анонсировала ряд новых оптимизаций производительности для алгоритмов искусственного интеллекта, которые теперь доступны в рамках экосистемы RTX, включая графические процессоры GeForce RTX, рабочие станции и ПК.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Nvidia отмечает, что последние оптимизации нацелены на ускорение работы ряда больших языковых моделей (LLM) использующихся генеративным ИИ. Новый драйвер Nvidia версии 555 обеспечивает видеокартам GeForce RTX и платформам RTX AI PC трёхкратный прирост ИИ-производительности при работе с фреймворками ONNX Runtime (ORT) и DirectML. Оба инструмента используются для запуска ИИ-моделей в среде операционной системы Windows.

Кроме того, новый драйвер увеличил производительность программного интерфейса WebNN для DirectML, который используется веб-разработчиками для размещения новых ИИ-моделей. Nvidia сообщает, что сотрудничает с Microsoft над дальнейшим повышением производительности графических процессоров RTX и добавлением поддержки DirectML в PyTorch. Ниже приведен полный список возможностей, которые предлагаются свежим драйвером Nvidia R555 для графических процессоров GeForce RTX и ПК с RTX:

  • поддержка метакоманды DQ-GEMM для обработки квантования INT4 только по весу для LLM;
  • новые методы нормализации RMSNorm для моделей Llama 2, Llama 3, Mistral и Phi-3;
  • механизмы группового и многозапросного внимания, а также внимания скользящего окна для поддержки Mistral;
  • обновления KV для улучшения внимания;
  • поддержка GEMM-тензоров, не кратных 8, для улучшения производительности контекстной фазы.

В тестах производительности ORT, генеративного расширения искусственного интеллекта, выпущенного Microsoft, новый драйвер Nvidia приводит к приросту производительности по всем направлениям, как для типов данных INT4, так и для FP16. Благодаря методам оптимизации, добавленным в это обновление, производительность больших языковых моделей Phi-3, Llama 3, Gemma и Mistral увеличивается до трёх раз.

Nvidia также напоминает, что преимущество экосистемы RTX заключается в использовании возможностей воспроизводительных тензорных ядер. На их основе работают DLSS Super Resolution, Nvidia Ace, RTX Remix, Omniverse, Broadcast, RTX Video и другие технологии. Кроме того, для использования тензорных ядер в ускорении работы ИИ компания предлагает комплекты разработчиков TensorRT, Maxine и RTX Video.

В своём пресс-релизе Nvidia сообщает, что её GPU обеспечивают ИИ-производительность до 1300 TOPS (триллионов операций в секунду), что гораздо выше возможностей любых других конкурентных решений.

Microsoft, OpenAI и другие обязались защитить человечество от мощных ИИ-систем

Крупнейшие технологические компании, включая Microsoft, Amazon и OpenAI, во вторник в ходе саммита AI Seoul Summit 2024 заключили международное соглашение о безопасности искусственного интеллекта, взяв на себя добровольное обязательство по обеспечению безопасной разработки своих самых передовых моделей ИИ.

 Источник изображения: GDJ/Pixabay

Источник изображения: GDJ/Pixabay

В рамках соглашения компании опубликуют концепции безопасности для своих передовых моделей, предусматривающие, в том числе, предотвращение использования технологии злоумышленниками.

Эти концепции будут включать «красные линии» для технологических компаний, определяющие риски, связанные с использованием систем ИИ, которые будут считаться «недопустимыми». В их числе автоматизированные кибератаки и угроза создания биологического оружия. Для реагирования на возникновение таких рисков компании планируют внедрить «аварийный выключатель», с помощью которого будет прекращена разработка ИИ-моделей, если нельзя будет гарантировать снижение этих рисков.

Согласованный на саммите пакт расширяет перечень обязательств разработчиков ИИ, принятый в ноябре прошлого года, и применяется только к так называемым пограничным моделям. Этот термин относится к технологии, используемой в системах генеративного ИИ, таких как семейство больших языковых моделей OpenAI GPT, лежащих в основе чат-бота ChatGPT.

С тех пор как OpenAI представила ChatGPT в ноябре 2022 года, регулирующие органы разных стран и технологические лидеры всё больше выражают беспокойство по поводу рисков, связанных с использованием инновационных систем ИИ. В связи с этим в марте 2024 года Европарламент одобрил первый в мире закон, которым регулируются использование и разработка ИИ.

Microsoft представила малую языковую модель Phi-3-Silica для компьютеров Copilot Plus PC

Вслед за презентацией компактной ИИ-модели Phi-3-vision, компания Microsoft представила на ежегодной конференции Microsoft Build 2024 ещё одну малую языковую модель (SLM) Phi-3-Silica, которая будет использоваться на компьютерах класса Copilot Plus PC. Эти ПК оснащены чипами со встроенным нейронным сопроцессором (NPU), обеспечивающим локальную работу функций на основе ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Это самая маленькая из всех моделей семейства Phi-3, обладающая 3,3 млрд параметров. Семейство Phi-3 также включает модель Phi-3-mini с 3,8 млрд параметров, Phi-3-vision (4,2 млрд параметров), Phi-3-small (7 млрд параметров) и Phi-3-medium (14 млрд параметров).

Как ожидается, первые ноутбуки под брендом Copilot Plus PC со встроенной Phi-3-Silica поступят в продажу в июне этого года. По данным Microsoft, показатель Time to first token (TTFT) у Phi-3-Silica составляет 650 токенов в секунду, а при работе модель потребляет около 1,5 Вт, освобождая мощности процессора и графического ускорителя ПК для обработки других вычислений. При генерации токенов модель повторно использует кеш-память KV NPU, сама генерация осуществляется на ЦП со скоростью примерно 27 токенов в секунду.

«Модели Phi-3 значительно превосходят языковые модели того же и большего размера по ключевым показателям. Phi-3-mini работает лучше, чем модели вдвое большего размера, а Phi-3-small и Phi-3-medium превосходят гораздо более крупные модели, включая GPT-3.5T», — отметила Microsoft.

ЕС принял первый в мире закон об искусственном интеллекте

Европейский союз окончательно согласовал первый в мире закон, регулирующий использование искусственного интеллекта. Документ устанавливает «всеобъемлющие правила» для технологий ИИ и основан на оценке рисков их применения в автономном транспорте, медицинских устройствах, финансовых сервисах и образовании.

 Источник изображения: Copilot

Источник изображения: Copilot

Закон является новаторским и устанавливает подход к регулированию ИИ. В частности, полностью будет запрещено использование так называемых систем «социального рейтинга», которые ранжируют граждан на основе анализа их данных. Также запрещено прогнозное моделирование для нужд полиции и использование эмоционального распознавания на рабочих местах и в школах, сообщает издание CNBC.

Системы ИИ высокого риска, такие как автономные автомобили, медицинские устройства, финансовые и образовательные сервисы, будут оцениваться на предмет угроз здоровью, безопасности и правам граждан. Кроме того, закон вводит жесткие ограничения на так называемые генеративные системы ИИ, к которым относится, например, ChatGPT. Для них устанавливаются требования соблюдения законодательства об авторских правах, раскрытия информации об обучении моделей, регулярного тестирования кибербезопасности.

Изменение в законодательстве ЕС произошло после запуска OpenAI ChatGPT в ноябре 2022 года. Тогда чиновники осознали, что существующее законодательство лишено проработанных деталей, которые важны в регулировании использования генеративным искусственным интеллектом материалов, защищенных авторским правом.

Полностью закон заработает не раньше чем через 12 месяцев, а уже существующие системы, такие как ChatGPT, Gemini и Copilot, получат переходный период на 36 месяцев для приведения в соответствие новым нормам. «Принятие закона об искусственном интеллекте является важной вехой для Европейского союза», — заявил государственный секретарь Бельгии по вопросам цифровизации Матье Мишель (Mathieu Michel).

За нарушение закона компании будут оштрафованы на сумму до 35 млн евро или 7% годовой выручки. Это коснется в первую очередь американских технологических гигантов, таких как Google, Microsoft и OpenAI. «Теперь внимание должно быть обращено на эффективную реализацию и обеспечение соблюдения закона об искусственном интеллекте», — заявила глава глобальной группы потребительских товаров и розничной торговли в ЕС Десислава Савова (Dessislava Savova).

Основная цель принятия данного закона заключается в обеспечении доверия, прозрачности и подотчетности при использовании технологий ИИ, не сдерживая при этом инновации.

У Windows Recall есть большая проблема помимо конфиденциальности — огромный аппетит к памяти

Новая функция Recall операционной системы Windows 11, которая в настоящий момент находится в стадии тестирования, вызвала много споров на тему безопасности. Однако у неё есть ещё один серьёзный недостаток. Она будет занимать значительное пространство постоянной памяти компьютера.

 Источник изображения: Mark Hachman / IDG

Источник изображения: Mark Hachman / IDG

Функция Recall станет частью ИИ-помощника Copilot в Windows 11 и предназначена для того, чтобы записывать каждое действие, совершённое с компьютером. Она будет время от времени делать скриншоты того, что отображается на экране компьютера, шифровать данную информацию и хранить её на локальном накопителе ПК. С помощью Recall пользователи смогут возвращаться к нужному моменту временной шкалы (ранее открытому приложению, файлу, видео, странице в браузере и т.д.).

Microsoft заверяет, что вся информация, сохраняемая Recall, будет храниться на компьютерах пользователя и не будет отправляться в облако. Функцию можно будет настроить, включив фильтр приложений и веб-сайтов, удалив определённые отрезки времени, чтобы они не сохранялись в Recall, или приостанавливать работу функции в любой момент с помощью значка на панели задач.

Формально речь идёт об очень мощном локальном поиске на ПК, который позволит находить любые данные на компьютере, даже если они не были сохранены привычным образом. Для одних пользователей функция Recall может показаться крайне полезной, для других она может оказаться пугающей, ведь теперь компьютер фактически будет следить за каждым шагом пользователя.

Однако вопрос безопасности — это лишь часть проблемы. Microsoft сообщила, что Recall будет занимать на накопителе ПК 50 Гбайт пространства. При этом около 25 Гбайт памяти будут активно ею использоваться для хранения информации. Как заявил представитель Microsoft в разговоре с изданием PC Mag, именно это является причиной, почему компания требует для работы функции наличия твердотельного накопителя объёмом не менее 256 Гбайт. Напомним, Recall будет доступна только на компьютерах категории Copilot Plus PC, к которым Microsoft выдвигает определённые технические требования.

По словам Microsoft, 25 Гбайт будет хватать для хранения в Recall примерно трёхмесячной истории. При заполнении выделенной памяти старые файлы будут заменяться новыми записями. Предполагается, что объём памяти для хранения данных можно будет увеличить. На данный момент неизвестно, будет ли Recall поддерживать подключение внешних накопителей.

На фоне ожидаемого роста цен на некоторые SSD всё это может привести к росту стоимости ПК.

Microsoft Edge научился на лету переводить на русский видео с YouTube и других сайтов — есть поддержка и других языков

Браузер Microsoft Edge скоро предложит функцию закадрового перевода и дублирования видео в реальном времени на таких сайтах, как YouTube, LinkedIn, Coursera и т.д. В рамках конференции Build, стартовавшей 21 мая в Сиэтле (США), компания Microsoft объявила, что новая функция, работающая на основе искусственного интеллекта, сможет переводить разговорный контент, предоставляя дубляж и субтитры прямо во время просмотра.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

В настоящее время эта функция поддерживает перевод с испанского на английский, а также перевод с английского на немецкий, хинди, итальянский, русский и испанский. Ожидается, что новая функция Edge на базе ИИ также сделает видео более доступными для слабослышащих или страдающих потерей слуха пользователей, предлагая автоматическое создание субтитров.

Microsoft сообщила, что Edge также будет поддерживать перевод устного контента в реальном времени на новостных сайтах, таких как Reuters, CNBC и Bloomberg. В дальнейшем компания планирует увеличить количество поддерживаемых сайтов, а также расширить возможности Edge по переводу большего количества языков.

Новая функция пополнит набор возможностей Edge на базе ИИ, появившихся у браузера благодаря интеграции с Copilot. В настоящее время Edge поддерживает возможность обобщения содержания видеороликов YouTube, но он пока не обладает способностью генерировать текстовые резюме для каждого видео, поскольку при их создании полагается на транскрипцию видео.

Благодаря ИИ процессоры с архитектурой RISC-V займут четверть рынка к 2030 году

Относительно молодую процессорную архитектуру RISC-V благодаря её открытости нередко выбирают в качестве основы для своих разработок молодые компании, поэтому специалисты Omdia ожидают, что она к 2030 году займёт четверть мирового рынка. Её продвижение будет особенно заметно в автомобильном и промышленном сегментах, но сфера искусственного интеллекта тоже проявит активность.

 Источник изображения: RISC-V

Источник изображения: RISC-V

Отсутствие необходимости платить лицензионные отчисления за разработку и последующую реализацию процессоров с архитектурой RISC-V привлекает к ней многих игроков, как и возможность подстроить наборы команд под собственные нужды. Исторически архитектура RISC-V долгое время ассоциировалась с сегментом промышленной автоматизации и Интернета вещей, поскольку первые решения на её основе по сути своей были микроконтроллерами.

Тем не менее, одной из наиболее активно растущих сфер применения процессоров с архитектурой RISC-V в период до 2030 года станет сегмент систем искусственного интеллекта. По прогнозам аналитиков Omdia, процессоры с архитектурой RISC-V найдут широкое применение в периферийных вычислениях, связанных с работой систем искусственного интеллекта. В период с 2024 по 2030 годы объёмы поставок процессоров с архитектурой RISC-V будут в среднем увеличиваться на 50 % ежегодно, как считают в Omdia. К концу периода прогнозирования мировые объёмы поставок таких процессоров вырастут до 17 млрд штук.

Из этого количества 46 % процессоров будут применяться в сегменте промышленной автоматизации, но автомобильный сегмент продемонстрирует самый активный рост, он составит до 66 % в год. В сегменте ИИ темпы роста популярности процессоров с архитектурой RISC-V тоже будут довольно высокими, но к концу десятилетия их объёмы поставок лишь едва превысят 500 млн штук.

Компактная модель Phi-3-vision от Microsoft умеет «читать» изображения

Компания Microsoft анонсировала ИИ-модель Phi-3-vision, новую версию своей небольшой языковой модели Phi-3, способную просматривать изображения и рассказывать пользователю о том, что на них изображено. Phi-3-vision является мультимодальной ИИ-моделью, обладающей способностью читать текст и просматривать изображения, предназначенной для использования в первую очередь на мобильных устройствах.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как сообщает Microsoft, Phi-3-vision, доступная в виде предварительной версии, представляет собой модель с 4,2 млрд параметров, которая может выполнять общие задачи на визуальное мышление, включая ответы на вопросы о диаграммах или изображениях.

Phi-3-vision гораздо меньше других ИИ-моделей, ориентированных на работу с изображениями, таких как DALL-E от OpenAI или Stable Diffusion от Stability AI. В отличие от этих моделей, Phi-3-vision не генерирует изображения, хотя способна понимать, что изображено на картинке, и анализировать изображение по запросу пользователя.

Microsoft представила модель Phi-3 в апреле, выпустив Phi-3-mini, самую маленькую модель семейства Phi-3 с 3,8 млрд параметров. Семейство Phi-3 также включает модель Phi-3-small (7 млрд параметров) и Phi-3-medium (14 млрд параметров).

Разработчики начали выпуск небольших и лёгких ИИ-моделей, таких как Phi-3, в связи с ростом спроса на использование более экономичных и менее ресурсоёмких сервисов ИИ. Небольшие ИИ-модели не занимают много места в памяти и поэтому их можно использовать на телефонах и ноутбуках.

Microsoft выпустила ряд небольших моделей в дополнение к Phi-3 и её предшественнику Phi-2. Её модель Orca-Math, ориентированная на решение математических задач, как сообщается, отвечает на математические вопросы лучше, чем более крупные аналоги, такие как Gemini Pro от Google.

ИИ-модели Phi-3-mini, Phi-3-small и Phi-3-medium уже доступны для использования и присутствуют в библиотеке моделей Azure.

Апскейлер Automatic Super Resolution в составе Windows сначала будет работать только с Qualcomm Snapdragon X Elite

Компания Microsoft ведёт разработку технологии масштабирования изображения Automatic Super Resolution (Auto SR) на уровне операционной системы Windows. Функцию можно будет использовать не только для игр, но и для приложений. Для этого в ОС будут присутствовать соответствующие настройки. Как выяснилось, изначально функция Auto SR будет доступна только для компьютеров, подпадающих под категорию Copilot Plus PC.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

Copilot Plus PC — новый бренд, которым будут обозначаться ноутбуки на Windows от разных производителей, оснащённые аппаратным обеспечением для работы искусственного интеллекта и поддерживающие функции ИИ во всей операционной системе. Вчера под этим брендом были представлены новые ноутбуки Surface от Microsoft, а также решения от Dell, Lenovo, Samsung, HP, Acer и Asus. Всех их объединяет одна вещь — в их основе используются Arm-процессоры Qualcomm Snapdragon X Elite. Изначально ПК именно с такими процессорами получат поддержку Auto SR. Другими словами, X86-совместимые чипы и даже 10-ядерные Arm-процессоры Snapdragon X Plus поддержку данной функции не получат. По крайней мере, не сразу. Также Auto SR будет работать только с определённым набором «отобранных игр».

 Источник изображения: Microsoft

Источник изображения: Microsoft

В описании Auto SR компания Microsoft не упоминает никакие другие процессоры, кроме Qualcomm Snapdragon X Elite. Однако в этом году состоится выпуск чипов AMD Strix Point и Intel Lunar Lake, которые должны также стать частью бренда Microsoft Copilot Plus PC.

Хотелось бы надеяться, что Auto SR не будет ограничена только этими процессорами и системами. У Windows сильное сообщество моддеров, поэтому в какой-то момент функция наверняка будет разблокирована для всех платформ и всех игр, если Microsoft сама не расширит её поддержку. А пока можно использовать встроенные в игры технологии масштабирования на уровне драйвера, например, Radeon Super Resolution, или воспользоваться сторонними инструментами, вроде Lossless Scaling.

Adobe добавила «Генеративное удаление» объектов в Lightroom

Компания Adobe представила функцию «Генеративное удаление» (Generative Remove) для графического редактора Lightroom — она основывается на модели искусственного интеллекта Firefly и позволяет легко редактировать объекты на фотографиях.

 Источник изображения: adobe.com

Источник изображения: adobe.com

Функция справляется со своей задачей независимо от того, насколько сложным является фон на фото, утверждает разработчик. Она сработает при удалении пятен с узорчатой рубашки, складок скатерти на фотографиях с продуктами питания, нежелательных отражений в воде и много другого.

Adobe начала внедрять функции генеративного ИИ в свои продукты в марте прошлого года, анонсировав модель Firefly — она объединила наработки компании в сферах изображений, типографики, иллюстраций и других направлений. Firefly позволяет генерировать изображения, предлагая широкий набор настроек: можно создавать картинки по текстовому запросу, стилизовать их по заданному образцу или производить векторную графику в Illustrator.

Компания, по её собственному утверждению, тесно сотрудничает с сообществом фотографов над улучшением и расширением возможностей новой функции, позволяющей удалять объекты при помощи генеративного ИИ. Adobe также сообщила о выходе функции Lens Blur для добавления эффекта боке в изображения, что поможет создавать ощущение глубины.

Китайские техногиганты снизили цены на доступ к своим моделям ИИ

Китайские технологические гиганты Alibaba и Baidu сообщили о снижении цен на большие языковые модели, составляющие основу продуктов с генеративным искусственным интеллектом. В секторе облачных вычислений Китая обостряется ценовая война, передаёт Reuters.

 Источник изображения: baidu.com

Источник изображения: baidu.com

Облачное подразделение Alibaba сообщило о снижении цен на значение до 97 % на большие языковые модели семейства Tongyi Qwen. Так, доступ к модели Qwen-Long будет обходиться всего 0,0005 юаня ($0,000069) за 1000 токенов — единиц данных, обрабатываемых платформой. До этого цена за те же 1000 токенов была 0,02 юаня ($0,002768). Примеру конкурента последовала Baidu, которая через несколько часов объявила, что её модели Ernie Speed и Ernie Lite станут бесплатными для всех бизнес-пользователей.

Ценовая война в сфере облачных вычислений в Китае продолжается уже несколько месяцев: недавно цены на работу с облачными ресурсами снизили Alibaba и Tencent. В конце 2022 года на волне успеха OpenAI ChatGPT в Китае началась волна инвестиций в проекты больших языковых моделей, после чего местные поставщики облачных решений начали предлагать услуги чат-ботов с ИИ для увеличения продаж.

На текущем этапе ценовая война грозит снижением прибыли компаний: выпущенные в марте модели Ernie Speed и Ernie Lite от Baidu до сегодняшнего дня были платными для корпоративных клиентов. На прошлой неделе компания ByteDance объявила, что её основная большая языковая модель Doubao будет обходиться бизнес-пользователям на 99,3 % дешевле, чем в среднем по отрасли. Китайские компании монетизируют свои проекты в области ИИ преимущественно за счёт корпоративных пользователей, но в отдельных случаях платные услуги предлагаются и потребителям. К примеру, стартап Moonshot ввёл плату за приоритетный доступ к своему чат-боту для обеих категорий пользователей; а Baidu взимает с потребителей 59 юаней ($8,16) в месяц за доступ к своей самой мощной модели Ernie 4.


window-new
Soft
Hard
Тренды 🔥
Cloudflare ускорила переход на постквантовую криптографию из-за роста угроз 4 ч.
Starfield вышла на PS5, получила второй сюжетный аддон и бесплатное обновление с бесшовными космическими путешествиями 4 ч.
CD Projekt Red раскрыла подробности улучшений Cyberpunk 2077 для PS5 Pro — обновление выйдет уже завтра 6 ч.
Надёжный инсайдер подтвердил планы Naughty Dog на Uncharted 5, но есть нюанс 7 ч.
Атмосферный хоррор-шутер Industria 2 о застрявшей в параллельной вселенной учёной из Восточного Берлина выйдет на следующей неделе 7 ч.
Балетный экшен «Царевна» отправит игроков в мир славянского тёмного фэнтези — первый геймплейный трейлер 8 ч.
Фанаты смогут подарить свою внешность персонажам игр PlayStation, начиная с Gran Turismo 7 — Sony анонсировала программу The Playerbase 9 ч.
Microsoft уже выпустила больше 80 различных Copilot — вся экосистема может включать более 100 продуктов 9 ч.
«Нет ничего невозможного»: директор ИРИ считает, что на полное импортозамещение компьютерных игр в России уйдет от трёх до пяти лет 10 ч.
THQ Nordic открыла предзаказы ремейка «Готики» — игра доступна и в российском Steam 10 ч.
Новая статья: Обзор Nothing Phone (4a) Pro: не такой, как все, — и не для каждого 52 мин.
Новая статья: Обзор материнской платы MSI MPG X870I EDGE TI EVO WIFI WiFi: флагман в форм-факторе mini-ITX? 3 ч.
Motorola представила смартфон Moto G Stylus (2026) со продвинутым стилусом 4 ч.
Ноутбучные процессоры Snapdragon X2 Elite ускорились в играх, но до звания геймерской платформы ещё далеко 5 ч.
Самодельный квадрокоптер с питанием от солнечных панелей провисел в воздухе рекордные пять часов — а после оператор устал 6 ч.
Apple оказалась не готова к популярности MacBook Neo — наметился дефицит чипов A18 Pro 7 ч.
Экипаж Artemis II показал полное солнечное затмение из-за Луны и прислал другие потрясающие фото 9 ч.
Австралийское неооблако Firmus при поддержке NVIDIA привлекло $505 млн и нарастило капитализацию до $5,5 млрд в преддверии IPO 10 ч.
Астронавт миссии Artemis II сфотографировал Луну на iPhone 10 ч.
Инвесторы требуют от Amazon, Microsoft и Google прозрачности отчётов о расходах воды и электроэнергии в ЦОД США 11 ч.