Сегодня 21 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-помощник
Быстрый переход

OpenAI завершила разработку мощной ИИ-модели o3-mini со способностью к рассуждению

Генеральный директор OpenAI Сэм Альтман (Sam Altman) сообщил в пятницу на платформе X о завершении работы над большой языковой моделью o3-mini, которую предполагается запустить в ближайшие пару недель. Он добавил, что компания учла пожелания пользователей и планирует выпустить интерфейс прикладного программирования (API) и ChatGPT одновременно.

 Источник изображения: Mariia Shalabaieva/unsplash.com

Источник изображения: Mariia Shalabaieva/unsplash.com

OpenAI представила большие языковые модели нового поколения o3 и o3-mini со способностью рассуждать в декабре прошлого года, охарактеризовав их как самые умные среди ИИ-решений в мире.

Модели o3 и o3-mini превосходят по производительности и возможностям «думающую» ИИ-модель o1, анонсированную в сентябре прошлого года. Компания ранее сообщила, что планирует запустить модель o3-mini к концу января 2025 года, после чего выйдет полномасштабная модель o3, рассчитывая, что более надёжные и умные большие языковые модели смогут превзойти существующие версии нейросетей, и это позволит привлечь новые инвестиции и увеличить аудиторию пользователей.

Также на этой неделе OpenAI представила бета-версию новой функции Scheduled tasks in ChatGPT («Запланированные задачи в ChatGPT»), позволяющую пользователям автоматизировать свою работу с помощью запланированных задач в ChatGPT. Как отметило агентство Reuters, это говорит о «вторжении» OpenAI в сферу деятельности умных помощников, превращая чат-бот ChatGPT в конкурента персональных ассистентов, таких как Siri, Alexa и др.

Microsoft решила, что подписчики Microsoft 365 будут платить на 30 % больше за ИИ-инструменты

Microsoft добавила функции Copilot в офисные приложения пакета Microsoft 365, увеличив стоимость подписки «Персональный» (Personal) и «Для семьи» (Home) на $3 в месяц. Существующие подписчики смогут продолжить использовать сервисы Microsoft 365 по старым тарифам до истечения оплаченного срока подписки. Также пользователи смогут остаться на прежних тарифах, отказавшись от функций Copilot.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Ранее доступ к ИИ-Ассистенту Copilot для приложений Word, Excel и PowerPoint предоставлялся лишь через отдельную подписку Copilot Pro за $20 в месяц. Теперь функция будет встроена в базовые пакеты Microsoft 365 с увеличением их стоимости. Однако, как сообщает The Verge, несмотря на изменение базовой подписки, Copilot Pro останется доступным за прежнюю цену в $20 в месяц для тех, кто хочет получать приоритетный доступ к новейшим ИИ-моделям и функциям. Подписка Microsoft 365 «Персональный» теперь стоит $99,99, а «Для семьи», позволяющая подключить до шести пользователей — $129,99.

Изначально Microsoft тестировала интеграцию Copilot в Microsoft 365 в Австралии, Новой Зеландии и некоторых странах Азии. Теперь функции искусственного интеллекта станут доступны пользователям практически по всему миру. По словам старшего директора по маркетингу Copilot Pro и Microsoft 365 Гарета Ойстрика (Gareth Oystryk), компания всегда стремилась сделать Copilot более массовым. «Мы знаем, что пользователи готовы платить за интеграцию ИИ в Microsoft 365, и нашей целью является возможность донести ценность этого до как можно большего числа людей», — подчеркнул Ойстрик.

Microsoft также вводит альтернативные планы для текущих подписчиков Personal Classic и Family Classic. Эти тарифы позволят сохранить прежнюю стоимость подписки без включения ИИ-функций. Однако, как отметили в компании, такие планы будут лишены значимых обновлений, ограничиваясь лишь обновлениями безопасности и незначительными улучшениями. Новые подписчики, напротив, автоматически получат доступ к ИИ, если обновят свой тариф.

Интересно, что в рамках изменений Microsoft также запускает систему ИИ-кредитов, которая будет работать в приложениях Word, Excel, PowerPoint, Outlook и OneNote. Подписчики офисного пакета будут ежемесячно получать кредиты на использование ИИ-функций, например генерацию изображений в Designer или других приложениях Windows. При этом пользователи Copilot Pro получат неограниченный доступ к всем возможностям. Для тех, кто не захочет использовать ИИ, Microsoft добавит возможность отключения Copilot — уже можно сделать это в Word, и в ближайшие недели в Excel и PowerPoint.

ChatGPT научился планировать и напоминать о делах, как Siri и «Google Ассистент»

OpenAI представила новую функцию под названием «Задачи» (Tasks), которая позволяет ChatGPT создавать напоминания и выполнять запланированные действия. Функция уже доступна в бета-версии и является попыткой превратить чат-бот в нечто большее, приблизив его к функциональности таких виртуальных помощников, как «Google Ассистент» или Siri.

 Источник изображения: Andrew Neel / Unsplash

Источник изображения: Andrew Neel / Unsplash

Tasks позволяет дать задание ChatGPT, что именно и когда нужно сделать. Например, можно попросить ежедневно присылать прогноз погоды в определённое время, напомнить о сроке действия паспорта или даже подготовить сказку для рассказа детям перед сном, поясняет The Verge.

Чтобы воспользоваться функцией, подписчикам нужно выбрать в меню ChatGPT модель «4o with scheduled tasks», затем просто сформулировать свою просьбу относительно того, что нужно сделать, и указать время выполнения. Кроме того, Tasks может рекомендовать задачи на основе предыдущих бесед, но пользователь должен вручную подтвердить каждую из таких рекомендаций. Управлять заданиями можно как в самих чатах, так и в новом разделе Tasks, доступном через веб-версию. После выполнения задач пользователи смогут получать уведомления на все свои устройства. Важно отметить, что одновременно может выполняться до 10 активных задач.

Нововведение уже доступно в бета-версии для подписчиков тарифов Plus, Team и Pro. OpenAI пока не уточняет, станет ли функция доступной для бесплатного использования, но предположительно, Tasks останется частью премиум-тарифов, которые стоят $20 или $200 в месяц.

Напомним, ранее чат-бот работал исключительно в режиме реального времени, отвечая на запросы в момент их поступления. Однако OpenAI решила несколько расширить рамки возможностей ChatGPT, превратив его в инструмент для долгосрочного планирования. Более того, на подходе новые разработки, такие как автономный агент Operator, который сможет управлять компьютерами, и проект Caterpillar, способный интегрироваться с Tasks для поиска информации, анализа данных, навигации по сайтам и работы с документами.

Отмечается, что несмотря на перспективы, у функции остаются нерешённые вопросы. Например, насколько надёжно Tasks будет справляться с задачами, особенно если речь идёт о важной и срочной информации. А запуск в бета-версии свидетельствует о том, что OpenAI пока лишь тестирует эту функцию с целью сбора отзывов от пользователей, не гарантируя стопроцентную надёжность.

ИИ-модель OpenAI o1 иногда думает на китайском языке, и никто не знает почему

Рассуждающая ИИ-модель OpenAI o1 удивляет лингвистическими способностями, переключаясь в процессе решения задач на разные языки, в том числе на китайский, даже если запрос был сделан на английском. Эксперты теряются в догадках, а OpenAI не спешит с объяснениями.

 Источник изображения: hdhAI

Источник изображения: hdhAI

OpenAI в прошлом году представила свою первую модель искусственного интеллекта (ИИ) с функциями рассуждения — o1. Однако пользователи заметили любопытную особенность: модель иногда начинает размышлять на китайском, персидском или других языках, даже если вопрос был задан на английском. Например, при решении задачи «Сколько букв R в слове strawberry?» o1 может выполнить часть рассуждений на китайском, прежде чем выдать окончательный ответ на английском.

Эксперты выдвигают несколько теорий, объясняющих это явление. Одной из них является гипотеза о влиянии китайских данных, на которых обучалась модель. Клемент Деланж (Clement Delangue), генеральный директор компании Hugging Face, разрабатывающей инструменты для создания приложений с использованием машинного обучения, и Тед Сяо (Ted Xiao), исследователь из Google DeepMind, отмечают, что многие компании, включая OpenAI, используют услуги сторонних китайских компаний для разметки данных, необходимых для обучения моделей. Это, по их мнению, и может приводить к тому, что модель o1 в некоторых случаях предпочитает в своих рассуждениях китайский язык, как более эффективный для обработки информации.

Однако не все согласны с этой теорией. Некоторые специалисты указывают на то, что влияние китайских данных не подтверждено и модель на самом деле может переключаться на разные языки, включая хинди и тайский. Это может быть связано с тем, что o1 просто выбирает наиболее удобный для себя способ решения задачи. По словам Мэтью Гуздиала (Matthew Guzdial), исследователя ИИ из университета Альберты, модель o1 не воспринимает языки как отдельные сущности, для неё это обычный текст, состоящий из набора токенов, который она обрабатывает.

В конечном итоге, точные причины поведения модели, рассуждающей на разных языках остаются загадкой. Лука Солдаини (Luca Soldaini), научный сотрудник Allen Institute for AI, подчёркивает, что из-за «непрозрачности ИИ-моделей невозможно точно установить, что происходит внутри» и как это всё функционирует. Сама OpenAI пока отмалчивается.

ИИ заменит человека в качестве основного пользователя приложений к 2030 году

Согласно исследованию компании Accenture, в ближайшее десятилетие может произойти кардинальная трансформация в сфере использования цифровых технологий, которая вызвана стремительным развитием искусственного интеллекта. К 2030 году ИИ-агенты станут основными пользователями приложений на предприятиях, а к 2032 году обычные потребители будут взаимодействовать с ИИ-агентами чаще, чем с приложениями, сообщает ZDNet.

 Источник изображения: Kandinsky

Источник изображения: Kandinsky

Эту трансформацию авторы доклада называют «большим бинарным взрывом», который произошёл в тот момент, когда фундаментальные ИИ-модели преодолели барьер естественного языка. По словам главного технического директора Accenture Картик Нараина (Karthik Narain), это событие дало старт изменениям в технологических системах и в том, как люди их проектируют и используют.

Нараин подчёркивает, что новые разработки «расширяют границы программного обеспечения, многократно увеличивают цифровой потенциал компаний и создают основу для когнитивных цифровых систем, которые глубоко интегрируют искусственный интеллект в структуру предприятий».

В отчёте также выделены три ключевых направления, которые будут определять технологическое развитие в ближайшие годы — это агентные системы, цифровое ядро и генеративные пользовательские интерфейсы. Эти направления будут развёрнуты на основе гибких и модульных строительных блоков, что позволит компаниям создавать легко масштабируемые и интеллектуальные цифровые компоненты.

Таким образом, исследование Accenture указывает на то, что в ближайшие годы главную роль в использовании цифровых технологий будут играть не люди, а автономные агенты, управляемые ИИ.

Gigabyte представила мощные игровые ноутбуки Aorus Master, Aero и Gaming, а также ИИ-помощника GiMATE

Компания Gigabyte представила на выставке CES 2025 ноутбуки следующего поколения серий Aorus Master, Gigabyte Aero и Gigabyte Gaming с поддержкой ИИ, а также ИИ-помощника GiMATE для бесшовного управления оборудованием и программным обеспечением.

 Источник изображения: Gigabyte

Источник изображения: Gigabyte

В новинках используются видеокарты серии GeForce RTX 50 от Gigabyte на базе архитектуры Nvidia Blackwell, получившие модернизированные решения для отвода тепла, гарантирующие высокую производительность видеокарт.

Флагманская серия ноутбуков Aorus Master включает модели с 18-дюймовым mini-LED-дисплеем и 16-дюймовым OLED-экраном. Ноутбуки Aorus Master предлагаются с процессором Intel Core Ultra 9 275HX и мобильной видеокартой Nvidia GeForce RTX 5090, обеспечивающими высокую производительность для тех, кто ищет игровые ПК с ИИ класса hi-end. Усовершенствованная система охлаждения WindForce Infinity EX обеспечивает пиковую эффективность до 270 Вт, что делает ее лучшей в своём классе на рынке. В её основе лежит передовой вентилятор Frost Fan высотой 158 мм с асимметричными лопастями для повышения эффективности охлаждения.

Модель Gigabyte Aero X16, сертифицированная Microsoft Copilot+ PC и оснащённая видеокартами GeForce RTX, предлагает самые передовые возможности ИИ для повседневных рабочих процессов, включая ChatRTX, RTX Remix, RTX Video, Nvidia Broadcast и многое другое. Ноутбук выполнен в компактном корпусе толщиной 16,7 мм весом 1,9 кг и обладает автономностью более 12 часов. Как сообщает Copilot+ PC, устройство отлично подходит как для игр, так и для создания контента, предлагая для работы полный набор функций Microsoft AI.

В свою очередь, Gigabyte Gaming A16 — тонкий игровой ноутбук с поддержкой ИИ, разработанный с учетом эргономики. Ноутбук оснащён удобной клавиатурой Gigabyte Golden Curve Keyboard и шарниром на 180 градусов, позволяющим его использовать для различных сценариев. Все новинки Gigabyte поддерживают технологию Dolby Atmos, обеспечивающую звук кинематографического качества.

Как сообщила Gigabyte, эксклюзивный GiMATE интегрируется с усовершенствованной моделью большого языка (LLM) и функцией Press and Speak, делая управление ноутбуком более естественным и интуитивным. Используя функцию AI Power Gear II для оптимальной энергоэффективности и AI Boost II для точного разгона аппаратной платформы, ИИ-агент обеспечивает оптимальные настройки для любого сценария. Функция AI Cooling позволяет снизить громкость работы кулера до 0 дБ, в то время как AI Audio и AI Voice оптимизируют звук для любых настроек. Функция AI Privacy обнаруживает присутствие посторонних и мгновенно активирует защиту экрана.

Глава OpenAI рассказал, когда появятся сильный ИИ, сопоставимый с человеком — ждать осталось недолго

Генеральный директор OpenAI поделился своим мнением о перспективах перехода от обычного искусственного интеллекта (ИИ) к созданию сильного искусственного интеллекта (AGI) или сверхинтеллекта, который способен думать как человек и даже превзойти его. По мнению Сэма Альтмана (Sam Altman), первые ИИ-агенты, соответствующие уровню AGI, могут появится уже в 2025 году.

 Источник изображения: Jonathan Kemper / Unsplash

Источник изображения: Jonathan Kemper / Unsplash

В своём блоге Альтман рассказал о будущем OpenAI. Основной целью компании на данный момент является создание «сверхинтеллекта в истинном смысле этого слова». Альтман подчеркнул, что инструменты на основе сверхинтеллекта приведут к инновациям и, как следствие, к росту благосостояния всего человечества. По его словам, новые ИИ-агенты будут превосходить интеллектуальные возможности людей и существенно изменят структуру компаний и результат их работы, войдя в «состав полноценной рабочей силы».

Однако, несмотря на оптимизм и обещания, в прошлом месяце Альтман попытался снизить ожидания в отношении AGI, заявив, что технология «будет иметь гораздо меньшее значение», чем полагают люди. И как отмечает The Verge, снижение акцента на традиционное определение AGI может быть выгодным для OpenAI в виду её тесного партнёрства с Microsoft, так как в рамках эксклюзивных соглашений от 2023 года OpenAI обязана официально объявить о создании AGI.

Однако Microsoft определяет свой интерес к AGI, в первую очередь, как к системе, способной генерировать $100 млрд прибыли, что на сегодня может создать определённые сложности, так как OpenAI пока не приносит прибыли и даже наоборот. Даже подписка ChatGPT Pro за $200 в месяц остаётся убыточной. «Люди используют этот инструмент гораздо чаще, чем мы ожидали», — написал Альтман в серии постов на платформе X. То есть, затраченные технические ресурсы на запросы и обработку пользовательских данных превышают цену подписки.

Хотя Альтман напрямую не упоминает о соглашении OpenAI с Microsoft о разделе прибыли, он вспоминает о произошедших событиях, которые привели к его увольнению с поста генерального директора OpenAI, затем найму в Microsoft и последующему возвращению в OpenAI в ноябре 2023 года. «Оглядываясь назад, я, конечно, хотел бы сделать всё по-другому, — говорит Альтман. — Необходимо построить более сильную систему управления OpenAI и следовать нашей миссии по достижению системы AGI, которая принесёт пользу всему человечеству».

Apple Intelligence стала занимать слишком много дискового пространства

Apple Intelligence обещала упростить жизнь, но пока лишь создаёт проблемы. Функция, запущенная в сентябре 2024 года, за четыре месяца увеличила свои требования к хранилищу с 4 до 7 Гбайт. Пользователи задаются вопросом, оправданы ли затраты на память и батарею, учитывая низкую эффективность функции Apple Intelligence в её текущем виде.

 Источник изображения: macrumors.com

Источник изображения: macrumors.com

Как сообщает издание Gizmodo, проблемы начались с выходом iOS 18.2 и macOS Sequoia 15.2. И хотя новые версии операционных систем расширили функциональность Apple Intelligence, добавив возможности генеративного ИИ, такие как Image Playground (создание изображений по запросу пользователя) и Genmoji для создания пользовательских эмодзи, это привело к значительному увеличению объёма данных, необходимых для работы системы.

Одной из причин возросших требований к памяти является использование локальной обработки. То есть, данные обрабатываются непосредственно на устройстве для обеспечения большей конфиденциальности, но при этом требуется хранение ИИ-моделей на самом гаджете. Кстати, именно поэтому доступ к Apple Intelligence имеют только устройства с мощными чипами M1, A17 или более новыми.

Так как Apple планирует и дальше развивать возможности ИИ, включая обновление голосового помощника Siri, то это значит, что требования к свободному пространству будут только расти. «Ожидайте, что эта функция будет продолжать заполнять ваше доступное хранилище в обозримом будущем», — отмечает не без доли горечи Gizmodo.

Между тем, согласно исследованию SellCell, большинство пользователей не в восторге от Apple Intelligence. 73 % владельцев iPhone, попробовавших функцию, считают, что она «не имеет особой ценности» для их пользовательского опыта. Кроме того, отмечаются жалобы на повышенный расход заряда батареи, связанный с работой искусственного интеллекта. В итоге, на данный момент Apple Intelligence, по мнению многих, не оправдывает затрат ресурсов, предлагая взамен лишь неточные пересказы новостей и необходимость чаще заряжать устройство.

Пока неясно, изменится ли отношение пользователей к Apple Intelligence с появлением новых, более востребованных функций, однако, несмотря на недовольство части пользователей и рост требований к хранилищу, Apple не собирается сворачивать с намеченного курса, делая серьёзную ставку на внедрение ИИ в свои устройства.

Anthropic выпустила мощную текстовую нейросеть Claude 3.5 Haiku — она вчетверо дороже флагманской Claude 3 Opus

Anthropic обновила свой чат-бот Claude, добавив большую языковую модель 3.5 Haiku. Новая нейросеть превосходит по производительности предыдущие версии, но и использование её будет обходиться дороже. При этом модель предлагает улучшенную генерацию текста, но пока не поддерживает анализ изображений.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Издание TechCrunch подтверждает, что модель, начиная со вчерашнего дня доступна в веб-версии Claude и на мобильных устройствах. Впервые представленная в ноябре, Claude 3.5 Haiku по некоторым тестам показывает результаты, равные или даже превосходящие флагманскую модель Anthropic, Claude 3 Opus. По словам компании, новинка идеально подходит для рекомендаций по программированию, извлечению и классификации данных, а также модерации контента. В отличие от своего предшественника, эта версия способна генерировать более длинные текстовые фрагменты и в неё заложена более свежая информации.

Однако в Claude 3.5 Haiku отсутствует поддержка анализа изображений, что ставит версию в невыгодное положение по сравнению с другими моделями Anthropic, такими как Claude 3 Haiku и 3.5 Sonnet. Релиз также вызвал определённую реакцию из-за изменения ценовой политики. Первоначально Anthropic заявляла, что стоимость новой модели будет такой же, как у её предшественника. Однако позже компания пересмотрела свою позицию, объяснив высокую стоимость улучшенными интеллектуальными возможностями новинки. «Во время финального тестирования мы обнаружили, что Haiku превзошёл Claude 3 Opus по многим показателям. В результате мы увеличили цену модели 3.5 Haiku, чтобы отразить её возможности», — заявила компания в своём посте на платформе X.

Стоимость использования Claude 3.5 Haiku начинается с $1 за миллион входных токенов (примерно 750 000 слов) и $5 за миллион выходных токенов. Для сравнения, использование Claude 3 Haiku обходится в 25 центов за миллион входных токенов и $1,25 за миллион выходных, что делает новую модель в четыре раза дороже. Несмотря на это, Anthropic продолжает предлагать Claude 3 Haiku как более экономичное решение с поддержкой анализа изображений. «Claude 3 Haiku останется доступным для пользователей, которым важна максимальная экономичность и функциональность обработки изображений», — отметил глава отдела по работе с разработчиками Алекс Альберт (Alex Albert).

Несмотря на критику из-за роста цен, Anthropic подчёркивает, что Claude 3.5 Haiku обладает улучшенными возможностями генерации текста и может ссылаться на более актуальные события. Однако повышение стоимости для модели в рамках одной серии, как отмечает TechCrunch, редкая практика в индустрии, которая ставит вопрос в плане дальнейшей стратегии ценовой политики компании на её продукты.

Google показала ИИ-агента, который помогает проходить игры, наблюдая за действиями игрока

Google представила новую версию платформы искусственного интеллекта Gemini 2.0, с помощью которой можно создавать ИИ-агентов для советов и подсказок в видеоиграх. Агенты способны анализировать игровой процесс и предлагать оптимальные стратегии, а пользователи смогут получать рекомендации в режиме реального времени.

 Источник изображения: Supercell, theverge.com

Источник изображения: Supercell, theverge.com

Как сообщают в блоге компании генеральный директор Google DeepMind Демис Хассабис (Demis Hassabis) и технический директор Корай Кавукчуоглу (Koray Kavukcuoglu), агенты «делают выводы об игре, основываясь исключительно на действиях на экране, и предлагают решения в режиме реального времени». Кроме того, они могут использовать поиск Google по базам знаний для предоставления более полной информации. Агенты уже тестируются в популярных играх, таких как Clash of Clans и Hay Day от Supercell. Однако, как пишет The Verge, технология находится на ранней стадии разработки, и пока не ясно, насколько полезными такие наставники окажутся для игроков.

Помимо помощи в видеоиграх, Google развивает и другие направления применения Gemini 2.0. Например, ведётся работа над проектом Genie 2, который создаёт виртуальные игровые миры на основе лишь одного изображения. Пока эти миры остаются стабильными только около минуты, однако эксперты видят большой потенциал технологии.

Также компания представила мультимодальные возможности Gemini 2.0 Flash, которые уже доступны разработчикам через API в Google AI Studio и Vertex AI. Новая версия отличается высокой скоростью работы, улучшенной обработкой данных и способностью генерировать изображения и текст, а также преобразовывать текст в речь на нескольких языках. Эти функции уже тестируются ранними партнёрами, а в январе платформа станет доступна широкой аудитории.

Среди других проектов можно выделить Project Astra, Mariner и Jules. Project Astra, созданный для использования на Android-устройствах, был улучшен с помощью Gemini 2.0. Теперь ассистент на базе Astra может разговаривать на нескольких языках, использовать Google Search, Maps и Lens, а также запоминать больше данных, сохраняя при этом конфиденциальность. Project Mariner исследует, как ИИ может помогать в браузере, распознавая текст, изображения, код и другие элементы интерфейса, а Jules предназначен для помощи разработчикам в их рабочих процессах на GitHub.

ИИ-агенты также могут применяться в физическом мире. Исследования Google показывают, что Gemini 2.0 способен использовать пространственное мышление в робототехнике. Хотя эти разработки находятся на ранней стадии, сама компания видит большой потенциал в создании агентов, которые способны взаимодействовать с реальной средой.

Чтобы минимизировать риски и обеспечить безопасность своих ИИ-сервисов, компания проводит масштабные тестирования, сотрудничает с доверенными тестировщиками и внешними экспертами. В ближайшем будущем Google планирует интегрировать возможности Gemini 2.0 во все свои продукты, включая мобильное приложение Gemini.

Google Gemini сможет управлять приложениями без пользователя и даже не открывая их

Система искусственного интеллекта Google Gemini получит новые возможности благодаря API App Functions, который позволяет выполнять действия в приложениях без их открытия. По данным The Verge, новая функция обнаружена в коде Android 16 для разработчиков и может стать доступна для всех пользователей уже в следующем году.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Функция App Functions, основанная на программном интерфейсе API (Application programming interface), может дать ассистенту Gemini возможность выполнять действия внутри приложений. На сайте разработчиков Google описывает app functions как «конкретную функциональность, которую приложение предоставляет системе, и которая одновременно может быть интегрирована в различные системные функции».

И хоть пока это звучит довольно расплывчато, Мишаал Рахман (Mishaal Rahman) из Android Authority приводит пример из документации, который проясняет суть. Например, разработчики приложений смогут открывать доступ посредством API к отдельным действиям, как, например, заказ еды, а Gemini сможет сделать заказ, не открывая приложения.

Интересно, что подобную функцию разрабатывает и Apple. В iOS 18 Siri также сможет выполнять действия внутри приложений через обновлённый фреймворк app intents. Например, пользователи смогут заказать что-либо в магазине через Siri, если разработчики определённого приложения подключат такую возможность. Однако внедрение этой функции в случае с Apple ожидается не раньше весны 2025 года.

Стоит отметить, что способность «выполнять действия за пользователя» изначально была одной из главных целей умных ассистентов, но её реализация начала появляться лишь недавно. Пока Gemini в основном ограничен поиском информации в Gmail или Google Maps. Что касается голосового помощника Siri в iOS 18, то он получил интеграцию с ChatGPT, за счёт чего можно задавать более сложные вопросы, но с выполнением действий Siri пока справляется хуже.

Судя по всему, и Google, и Apple закладывают фундамент для более «умных» ассистентов, которые смогут выполнять сложные задачи внутри приложений, и это произойдёт уже очень скоро.

OpenAI планирует выпустить ИИ-агента Operator в январе — он сможет управлять ПК без пользователя

Компания OpenAI готовится к выпуску нового ИИ-агента под кодовым названием Operator, который позволит выполнять разнообразные задачи на компьютере пользователя. Релиз этого инструмента может состояться уже в январе 2025 года.

 Источник изображения: OpenAI

Источник изображения: OpenAI

На первом этапе упомянутое решение будет доступно в качестве предварительной исследовательской версии через API для разработчиков. Operator призван конкурировать с аналогичными ИИ-агентами, такими как недавно представленный Computer Use компании Anthropic и разрабатываемый ИИ-агент Google, ориентированный на потребительский рынок.

OpenAI стремится создать универсальный инструмент, способный выполнять различные операции в веб-браузере и подходящий для решения повседневных задач пользователей. Однако, как отмечает издание Bloomberg, пока неизвестно, предложит ли Operator пользователям значительные преимущества перед аналогичными решениями конкурентов. Исследовательская версия инструмента будет полезна для оценки его потенциальных преимуществ и выявления областей, требующих доработки на основе обратной связи.

Запуск Operator совпадает с публикацией документа OpenAI, содержащего рекомендации для правительства США по вопросам стратегии развития ИИ. В этом документе предлагается создание «экономических зон» для активного развития ИИ-инфраструктуры, а также формирование альянсов с союзниками США, что позволит усилить позиции страны в технологической гонке с Китаем.

ИИ-поиск Google теперь доступен в 100 странах, в том числе Узбекистане и Кыргызстане — России в списке не оказалось

Компания Google объявила о запуске поисковых ИИ-обзоров в более чем 100 странах. Сгенерированные сводки (AI Overviews) будут отображаться для пользователей в Канаде, Австралии, Южной Африке, Нигерии, Узбекистане, Туркменистане, Кыргызстане и многих других странах. Полный список добавленных стран доступен на официальном сайте Google.

 Источник изображения: Copilot

Источник изображения: Copilot

По информации The Verge, ИИ-обзоры будут отображаться на всех поддерживаемых языках, включая английский, хинди, индонезийский, японский, португальский и испанский. Это означает, что пользователи в таких странах, как США, смогут выполнять поиск, например, на испанском языке и получать результаты суммирования информации на том же языке.

Кроме того, ссылки на цитируемые источники в ИИ-обзорах стали более заметными, что сделано для удобства пользователей, если они захотят получить больше информации, перейдя на первоисточник, а также чтобы не лишать сайты трафика.

Ранее сообщалось, что в октябре Google добавила рекламу в ИИ-обзоры на мобильных устройствах, но пока только для пользователей в США. В других странах реклама будет продолжать показываться в специальных слотах на странице, а не внутри самих сводок.

Напомним, функция AI Overviews была впервые запущена в США в мае, а затем в августе стала доступна пользователям в Великобритании, Индии, Японии, Индонезии, Мексике и Бразилии.

Apple Intelligence появится в ЕС только в апреле 2025 года

Компания Apple не будет торопиться с расширением географии своего ИИ-сервиса. После сегодняшнего запуска в США Apple Intelligence сначала дебютируют в декабре в других англоязычных странах, а в странах Евросоюза он появится только будущей весной. Сервис будет поддерживать локальные языки стран и предложит почти полный набор функций, улучшенную Siri и интеграцию с ChatGPT.

 Источник изображения: BoliviaInteligente/Unsplash

Источник изображения: BoliviaInteligente/Unsplash

Apple официально объявила, что её сервис Apple Intelligence станет доступен пользователям в Европейском союзе с апреля 2025 года, сообщает издание TechCrunch. Ранее предполагалось, что технические правила ЕС, а именно закон «О цифровых рынках» Европейского союза (DMA), ограничит запуск технологии в регионе. «Этой весной функции Apple Intelligence начнут развёртываться для пользователей iPhone и iPad в ЕС. В их числе будут Writing Tools, Genmoji, обновлённая Siri с улучшенным пониманием языка, интеграция с ChatGPT и многое другое», — заявляется в пресс-релизе компании.

На данный момент, с выходом iOS 18.1, Apple начала постепенно внедрять функции искусственного интеллекта для последних моделей iPhone, iPad и Mac. Когда Apple Intelligence впервые был представлен на конференции разработчиков WWDC в июне, компания предупреждала, что функции будут внедряться медленно и на первом этапе будут доступны только на американском английском языке. Это всё ещё остаётся актуальным, и для использования сервиса пользовательские устройства должны быть настроены именно на этот язык. Если же Apple ID привязан к европейскому адресу, доступ к сервису на iPhone сейчас невозможен.

При этом владельцы Mac в Европе уже могут опробовать некоторые функции Apple Intelligence. Если у пользователя есть Mac с чипом M1 или новее, достаточно изменить язык системы на американский вариант английского языка, чтобы активировать сервис. Предположительно, эта возможность связана с тем, что Apple признана среди прочих крупных платформ «привратником» (gatekeeper) — основным посредником между бизнес-пользователями и потребителями в рамках DMA, но только в отношении устройств iOS, iPadOS, App Store и Safari. macOS под действие этих правил не попадает.

Apple также подтвердила, что в ближайшее время планирует расширить языковую поддержку. Уже в декабре 2024 года будет добавлена локализованная английская версия для Австралии, Канады, Ирландии, Новой Зеландии, Южной Африкт и Великобритании, а в течение 2025 года сервис станет доступен ещё на двенадцати языках, включая французский, немецкий, итальянский, португальский и испанский.

Единственной функцией, которая, по предварительным данным, не будет доступна в ЕС, окажется «Сводки уведомлений». Более детальных комментариев по этому поводу Apple пока не дала.

Новая статья: Умные помощники: подборка Telegram-ботов с искусственным интеллектом

Данные берутся из публикации Умные помощники: подборка Telegram-ботов с искусственным интеллектом


window-new
Soft
Hard
Тренды 🔥
Xiaomi представила WinPlay — эмулятор для запуска игр для Windows на планшете с Android 12 мин.
У Nvidia закончились игровые видеокарты в облаке 20 мин.
Российское ПО не удовлетворяет 63 % айтишников по части совместимости с другим софтом 27 мин.
Олдскульная стратегия Tempest Rising в духе Command & Conquer стала доступна для предзаказа в российском Steam и обзавелась временной демоверсией 36 мин.
Золотой век наступил раньше времени: разработка Sid Meier’s Civilization VII официально завершена 2 ч.
«Мечты сбываются»: амбициозный мод GTA: Vice City Nextgen Edition на движке от GTA IV наконец получил точную дату выхода 2 ч.
RuStore стал вторым самым популярным магазином Android-приложений в России 3 ч.
«Начало новой эры»: Marvel Snap возобновила работу в США после разблокировки TikTok и готовится к переменам 4 ч.
Трамп подписал указ, который отсрочил на 75 дней блокировку TikTok в США 7 ч.
Canon выпустила приложение для стриминга с нескольких камер, но не своих собственных 8 ч.