Сегодня 05 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gemini
Быстрый переход

Google Gemini научился превращать фото в восьмисекундные видео со звуком, но небесплатно

Google обучила свой ИИ-чат-бот Gemini анимировать статичные фотографии, преобразовывая их в видеоклипы длительностью 8 секунд. Функция основана на видеомодели Veo 3 и также может дополнить клип звуковым сопровождением в виде фоновых шумов, звуков окружающей среды и речи.

 Источник изображения: Google

Источник изображения: Google

Чтобы превратить фотографии в видео, достаточно выбрать «Видео» в меню инструментов чат-бота и загрузить фотографию. Затем можно добавить текстовое описание того, что вы хотите увидеть и услышать. Как итог — ролик в формате MP4 с разрешением 720p и соотношением сторон 16:9.

Во всех роликах будет видимый водяной знак, подтверждающий, что видео создано ИИ, а также невидимый цифровой водяной знак SynthID. Функция уже доступна платным подписчикам Google AI Ultra и Pro «в отдельных странах». В течение недели она появится и на мобильных устройствах.

ИИ-помощник Google Gemini появился на Pixel Watch и других смарт-часах с Wear OS

На конференции Google I/O в мае компания пообещала в скором будущем выпустить приложение помощника с искусственным интеллектом Gemini для умных часов под управлением Wear OS. Накануне сервис действительно дебютировал на устройствах этого типа — первыми его получили модели серии Samsung Galaxy Watch8.

 Источник изображения: Google

Источник изображения: Google

Из-за компактного размера и отсутствия камер умные часы не смогут работать с полноценным вариантом Gemini (с функцией Gemini Live), доступным на смартфонах и ПК, но самые важные голосовые функции поддерживаются. Можно задавать Gemini практически любые вопросы, и он будет давать ответы либо из собственной базы знаний, либо по результатам веб-поиска. Это пригодится, когда ответ требуется получить быстро, например, если во время готовки руки заняты, необходимо подкорректировать рецепт, а доставать телефон неудобно.

Gemini может работать с приложениями Google и сторонних разработчиков — поддерживается создание заметок, постановка задач, создание напоминаний и событий в календаре и многое другое прямо на умных часах. Можно попросить помощника отправить сообщение другу с извинениями за опоздание; получить краткий пересказ поступившего письма; найти адрес для визита к специалисту и сделать многое другое. Gemini начнёт развёртываться на смарт-часах под управлением Wear OS 4 и выше, включая модели от Samsung, Pixel, OnePlus, Oppo и Xiaomi. Последняя версия Wear OS 6 не требуется, но она позволяет ИИ-помощнику интегрироваться с приложениями от производителей часов: данная версия основана на Android 16, в котором появился API App Functions, позволяющий ИИ-помощникам использовать сторонние приложения.

Пока под управлением Wear OS 6 работают только умные часы серии Samsung Galaxy Watch8; платформа также будет работать на других новых устройствах. Прочие модели получат Wear OS 6 с обновлениями ПО, в которых Gemini, вероятно, придёт на смену привычному «Google Ассистенту».

ИИ-функция Circle to Search получила AI Mode и теперь может помочь в прохождении игр

Google расширила функциональность ИИ-инструментов Circle to Search («Обвести и найти») и Gemini Live для Android. Обновление было анонсировано сегодня, одновременно с запуском складных устройств Samsung Galaxy нового поколения. Оно включает новые возможности Gemini Live для устройств Samsung и интеграцию чат-бота Google AI Mode, ориентированного на поиск, непосредственно в Circle to Search.

 Источник изображений: Google

Источник изображений: Google

Режим AI Mode дебютировал в Google Поиске в начале этого года, позволяя пользователям находить информацию и веб-ссылки с помощью чат-бота в стиле Gemini вместо традиционного интерфейса поисковой системы. Пока он недоступен для широкого круга пользователей — за пределами США его запустили только в Индии, — однако теперь, по заявлению Google, получить доступ к AI Mode можно с помощью инструмента Circle to Search на смартфонах Pixel и Samsung. Это позволяет находить информацию прямо на экране, не переключаясь между приложениями.

«Просто нажмите и удерживайте кнопку “Домой” или панель навигации, затем обведите, коснитесь или сделайте жест на том, что хотите найти. Если ответ ИИ покажется вам наиболее полезным, в результатах появится AI Overview. Отсюда прокрутите вниз и нажмите “Подробнее с режимом ИИ”, чтобы задать уточняющие вопросы и узнать больше о визуальном поиске», — говорится в сообщении Google в её блоге.

Circle to Search теперь также может предоставлять внутриигровую помощь мобильным геймерам. Эту функцию Google тестировала ещё в январе. Её можно использовать для поиска информации о персонажах и стратегиях, не выходя из игры, а также для просмотра статей и видео, связанных с конкретным игровым моментом, в котором требуется помощь. Google также заявила, что работает над внедрением режима поиска AI Mode в Google Lens через приложение Google для Android- и iOS-устройств.

Новые Galaxy Z Fold7, Galaxy Z Flip7 и Watch 8, представленные сегодня на мероприятии Samsung Unpacked, стали первыми устройствами с предустановленными Android 16 и Wear OS 6. Google также анонсировала обновление Gemini Live для смартфона Flip 7, которое добавляет возможность передачи изображения с камеры устройства на внешний экран. Это позволяет ИИ-помощнику отвечать на вопросы о том, что он «видит», без необходимости открывать телефон.

Интеграция Gemini Live теперь поддерживается в таких приложениях Samsung, как «Календарь», «Заметки» и «Напоминания». По словам Google, вскоре поддержка Gemini Live появится и в приложениях других производителей. Кроме того, Gemini будет поддерживаться на смарт-часах под управлением Wear OS 6, устройствах Pixel, OnePlus, Oppo, Xiaomi, а также на новых моделях Samsung — Watch 8, Watch 8 Classic и Watch Ultra (2025).

Google открыла Gemini доступ ко всем приложениям на Android и толком не объяснила, как от этого отказаться

Google накануне, 7 июля, развернула изменения, благодаря которым помощник с искусственным интеллектом Gemini получил возможность взаимодействовать со сторонними приложениями, в том числе WhatsApp, даже если пользователи ранее запретили такие взаимодействия. Отказаться от этой функции очень непросто, и в Google простых инструкций не предоставили.

 Источник изображений: blog.google

Источник изображений: blog.google

О нововведении Google сообщила пользователям в электронном письме, где сослалась на страницу поддержки — на ней говорится, что данные, к которым имеет доступ Gemini, «читают, комментируют и обрабатывают люди-рецензенты (включая поставщиков услуг)». В письме отсутствуют полезные рекомендации по действиям, которые следует предпринять, чтобы отказаться от указанных изменений; зато говорится, что пользователи могут блокировать приложения для взаимодействия с Gemini, но даже в этом случае собранные данные хранятся 72 часа.

В письме не объясняется, можно ли полностью удалить Gemini с устройств под управлением Android; и, видимо, оно противоречит само себе относительно того, как это сделать, и возможно ли это вообще. В одном месте говорится, что изменения развёртываются в автоматическом режиме со вчерашнего дня, открывая Gemini доступ к таким приложениям как WhatsApp, «Google Сообщения» и «Google Телефон». Ниже по тексту указывается: «Если вы уже отключили эти функции, они останутся отключёнными». О возможности полностью удалить механизмы интеграции Gemini не сообщается нигде.

Пользователи одного из серверов соцсети Mastodon и журналисты Ars Technica заинтересовались вопросом, но в справочном разделе Google им удалось только найти инструкцию по настройке Gemini в учётной записи — минимум в одном из случаев само приложение на устройстве в явном виде отсутствовало. В стремлении прояснить ситуацию они обратились за помощью к Google, но в компании ответа на вопрос не дали, и, в частности, заявили: «Это обновление полезно для пользователей: теперь они могут пользоваться Gemini для выполнения повседневных задач на мобильных устройствах, в том числе для отправки сообщений, совершения телефонных звонков и установки таймеров при отключённой [настройке] Gemini Apps Activity. Когда Gemini Apps Activity отключена, их переписка не читается и не используется для улучшения наших моделей ИИ». Представитель компании также продублировал ссылку на одну из обнаруженных ранее страниц, содержимое которой не прояснило ситуацию.

Дополнительно прояснить ситуацию попытались эксперты компании Tuta — поставщика конфиденциальных сервисов электронной почты и календаря. Они сделали вывод, что своей интеграцией Gemini в Android компания Google решила пойти по стопам Microsoft с её Internet Explorer в Windows — тогда всё закончилось затяжным судебным разбирательством. По версии Tuta, отключение Gemini Apps Activity предотвратит дальнейший сбор данных, а собранная ранее информация будет удалена за 72 часа; на устройства без установленного приложения Gemini оно самопроизвольно устанавливаться не станет. Один из способов защитить свою конфиденциальность — полное удаление Gemini с устройства, но для этого может понадобиться запуск отладки Android и работа с интерфейсом командной строки.

В Gmail, «Диске» и других сервисах Google появились ИИ-боты Gem, настраиваемые под конкретные задачи

Google открыла пользователям приложений Workspace доступ к Gem — настраиваемым версиям помощника с искусственным интеллектом Gemini, которые специализируются на определённых задачах, и приложение Gemini для этого открывать не требуется.

 Источник изображения: workspaceupdates.googleblog.com

Источник изображения: workspaceupdates.googleblog.com

Чат-боты Gem открываются на боковой панели в службах «Документы», «Таблицы», «Презентации», «Диск» и Gmail — для работы с определённым чат-ботом не потребуется переключаться между приложениями. Управляя чат-ботом, можно сделать его «экспертом» в определённых задачах, с которыми пользователь работает регулярно — это может быть написание текстов для одного бренда или подготовка к экзаменам. Google также предлагает настроенные версии Gem для редактирования текста, написания кода, генерации идей для продаж и для других целей. Вот какие варианты предлагает сама компания:

  • Gem-копирайтер для написания публикаций и прочих материалов, адаптированных для указанной целевой аудитории;
  • Gem, который поможет с продажами, исходя из информации о конкретной компании, потенциальном клиенте или отрасли;
  • адаптированный для должности пользователя «помощник Gem», предоставляющий релевантные сводки и материалы для внутренних публикаций;
  • Gem, разработанный для взаимодействия с определённым лицом — топ-менеджером или гендиректором, — генерирующий убедительные сообщения.

Ранее настраиваемыми чат-ботами Gem можно было пользоваться только в приложении Gemini. Сейчас создавать новые варианты можно прямо из боковой панели Workspace. Новые возможности начали развёртываться для всех пользователей платформы с доступом к Gemini со вчерашнего дня, но в отдельных случаях придётся подождать «более 15 дней».

Google доработала и перезапустила ИИ-функцию Ask Photos для поиска фото по содержимому

После небольшой паузы Google вернулась к развёртыванию функции Ask Photos на базе искусственного интеллекта, которая позволяет осуществлять поиск по содержимому снимков. Разработчики не только расширили доступность этого ИИ-инструмента, но и внесли ряд улучшений в его работу.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Функция Ask Photos задействует ИИ-помощника Gemini, чтобы пользователь мог находить фотографии на основе их содержимого. Ранее в этом месяце Google приостановила развёртывание функции, а представитель компании заявил, что Ask Photos «не соответствует требованиям с точки зрения скорости обработки запросов, качества и удобства использования».

Позднее Google сообщила, что компания услышала отзывы пользователей, в том числе касательно того, что ИИ-функция поиска по содержимому фото должна работать быстрее, отвечая на простые запросы, такие как «пляж» или «животные». Теперь функция моментально выдаёт результаты поиска на простые запросы, тогда как Gemini продолжает работать в фоновом режиме, чтобы находить больше соответствующих запросу снимков. В дополнение к этому Google сообщила, что Ask Photos выходит за рамки раннего доступа и становится доступна большему количеству пользователей в США.

Google Assistant скоро уступит место на Android-устройствах нейросети Gemini

На Android скоро появится возможность использовать нейросеть Gemini для управления устройством без нарушения конфиденциальности. Как стало известно из уведомления Google, отправленного пользователям и изученного изданием Android Police, с 7 июля ИИ-ассистент сможет управлять телефонными звонками, сообщениями, WhatsApp и другими системными функциями. Пользователи смогут давать команды боту, не опасаясь, что их диалоги будут использоваться для обучения ИИ при активированной опции Gemini Apps.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Ранее отключение опции Gemini Apps не только запрещало Google использовать диалоги с Gemini, но и ограничивало функциональность самого ассистента. Теперь же пользователи смогут поручить боту, например, установить будильник, позвонить контакту или отправить сообщение в мессенджере, не разрешая при этом запоминать и анализировать свои запросы, пишет The Verge.

Первоначальная формулировка уведомления Google вызвала вопросы, так как некоторые пользователи заподозрили, что обновление может предоставить нейросети доступ ко всей информации на устройстве. Однако представители компании пояснили, что разрешения на работу с приложениями полностью остаются под контролем владельца устройства, а обновление направлено на улучшение пользовательского опыта.

Отмечается, что этот шаг стал частью плана по замене Google Assistant на устройствах Android на более продвинутую ИИ-модель Gemini, которая сможет выполнять те же функции, что и прежний голосовой помощник, но с гибкими настройками приватности. При этом компания оставляет за собой право хранить данные о взаимодействии с нейросетью до 72 часов с целью обеспечения безопасности.

Google AI Pro стал доступен по годовой подписке — экономия составит 16%

Компания Google расширила варианты подписки на премиум-тариф Google AI Pro, который предоставляет расширенный доступ к функциям и моделям искусственного интеллекта, включая Gemini. Теперь, помимо ежемесячной подписки за $19,99, также появится годовая подписка стоимостью $199,99, позволив сэкономить $40 в год.

 Источник изображения: Google

Источник изображения: Google

Как поясняет 9to5Google, ранее сервис, изначально называвшийся Google One AI Premium, предлагал только ежемесячные платежи, хотя годовая подписка уже была доступна для тарифа с 5 Тбайт за $249,99. Обладатели годовой подписки получают 2 Тбайт в Google Drive, Gmail и Photos, расширенные возможности Gemini, включая повышенные лимиты для версии 2.5 Pro.

Также доступно лимитированное использование генератора видео Veo 3, который может создавать видеоролики на основе текстовых описаний, включая звуковое сопровождение, в разрешении до 4K с продолжительностью видео до нескольких минут. После исчерпания квот можно использовать генератор Veo 2, также предназначенный для генерации видео по текстовому запросу, но с меньшей функциональностью.

Доступен и инструмент для создания фильмов Flow с частичным доступом к Veo 3. Напомним, Flow — это первый общедоступный продукт Google, который объединяет три ключевые ИИ-системы компании. Открывая новые возможности для видеопроизводства, Flow формирует уникальную визуальную эстетику, где операторская работа и аудио создаются нейросетями с минимальным участием человека.

В рамках подписки предоставляется 1000 ежемесячных ИИ-кредитов на создание видео, расширенные возможности использования NotebookLM, интеграция Gemini в Gmail, Docs, Vids и другие сервисы, увеличенная продолжительность встреч в Google Meet, возможность планирования встреч через Google Calendar и возврат 10 % от покупок в Google Store.

 Источник изображения: 9to5google.com

Источник изображения: 9to5google.com

Lenovo выпустила самый передовой хромбук — с ИИ-функциями Google и 3-нм процессором MediaTek Kompanio Ultra 910

Компания Lenovo выпустила новое, десятое поколение ноутбука Chromebook Plus 14. В основе новинки используется процессор MediaTek Kompanio Ultra 910 (3-нм техпроцесс, одно ядро Cortex-X925 с частотой 3,62 ГГц, три Cortex-X4 и четыре Cortex-A720; графика — GPU Immortalis-G925 MC11).

 Источник изображений: Lenovo

Источник изображений: Lenovo

Новый Chromebook Plus 14 оснащён 14-дюймовым OLED-экраном с соотношением сторон 16:10, разрешением 1920 × 1200 пикселей, яркостью 400 кд/м² и 100-процентным охватом цветового пространства DCI-P3. Lenovo предлагает конфигурации с 12 или 16 Гбайт оперативной памяти LPDDR5X, а также с 128 или 256 Гбайт постоянной памяти UFS. Устройство поддерживает Wi-Fi 7 и Bluetooth 5.4, оснащено двумя портами USB-C 3.2 Gen1, одним USB-A 3.2 Gen1 и комбинированным 3,5-мм аудиоразъёмом.

Вес ноутбука составляет 1,17 кг (в версии без сенсорного экрана) и 1,26 кг (с сенсорным экраном), толщина корпуса — 15,8 мм. Устройство оснащено аккумулятором ёмкостью 60 Вт·ч, обеспечивающим до 17 часов автономной работы. В комплект входит зарядное устройство мощностью 65 Вт, которое заряжает аккумулятор до 80 % примерно за час.

Chromebook Plus 14 предлагает 5-Мп веб-камеру с двумя микрофонами и шторкой конфиденциальности, а также опционально — сканер отпечатков пальцев. Процессор Kompanio Ultra обеспечивает 50 TOPS производительности в задачах ИИ и позволяет локально использовать ряд интеллектуальных функций, включая:

  • умную группировку вкладок и документов на основе активности пользователя;

  • редактирование изображений в приложении «Галерея» (удаление фона, создание наклеек);
  • преобразование рукописного текста в цифровой в реальном времени;
  • визуальный поиск по скриншотам с помощью Google Lens;
  • функции «Создать краткое содержание» и «Упростить» для работы с объёмными или сложными текстами.

С покупкой Chromebook Plus 14 предлагается 12-месячная пробная подписка на сервис Google AI Pro, включающая доступ к ИИ-ассистенту Gemini в Gmail и Docs, 2 Тбайт хранилища Google One, а также интеграцию с NotebookLM от Google для анализа и структурирования информации.

Это первый ноутбук в серии Chromebook Plus с поддержкой технологии Dolby Atmos — устройство оснащено четырьмя динамиками. Корпус выполнен в цвете Seashell (морская ракушка), ноутбук имеет шарнир с углом раскрытия 160° и поддерживает дополнительные фирменные аксессуары — чехол Lenovo Urban Sleeve, мышь 540 USB-C и аналоговую гарнитуру.

Стоимость Chromebook Plus 14 в Германии составит 649 евро. Для других стран цена пока не объявлена. В продажу устройство поступит уже на этой неделе.

ИИ-поисковик Google научился понимать голосовые запросы, но доступна функция не всем

Google начала тестировать функцию Search Live в режиме поиска с ИИ — AI Mode. Новая функция позволяет задавать вопросы ИИ-чат-боту голосом прямо из поисковой системы. Открытое тестирование доступно пока только в США и исключительно для участников программы Google Labs по тестированию экспериментальных функций. На данный момент Search Live не поддерживает использование камеры смартфона, но Google планирует добавить такую возможность «в ближайшие месяцы».

 Источник изображений: Google

Источник изображений: Google

Search Live позволяет взаимодействовать со специально адаптированной версией ИИ-помощника Gemini и выполнять поиск в интернете в режиме реального времени. Функция доступна в приложении Google для Android и iOS. В будущем Search Live получит поддержку камеры смартфона — пользователь сможет навести её на объект и задать голосом интересующий вопрос о нём.

Google анонсировала функцию Search Live для режима поиска с ИИ AI Mode в прошлом месяце. Она является частью более широкой программы компании по трансформации своей поисковой системы и расширению его ИИ-возможностей. Сейчас компания, например, также экспериментирует с ИИ-функцией, которая превращает результаты поиска в подкаст. После запроса пользователя и вывода чат-ботом результатов, пользователь может использовать функцию Generate Audio Overview и ИИ предоставит ответ в аудиоформате в виде кратного подкаст-обзора по теме.

Принять участие в тестировании Search Live можно через Google Labs (в России недоступен), после чего в приложении Google на Android или iOS станет активен новый значок Live. Затем чат-боту можно вслух задать, например, такой вопрос: «Как предотвратить появление складок на льняном платье, упакованном в чемодан?». Чат-бот предложит ответ, а пользователь сможет задать уточняющий вопрос, например: «Что делать, если оно всё равно мнётся?». Search Live также предложит ссылки на материалы с возможными решениями во время диалога.

Другие ИИ-компании также внедряют голосовые режимы в своих чат-ботах. Так, OpenAI представила расширенный голосовой режим для ChatGPT в прошлом году, а Anthropic запустила голосовую функцию в приложении Claude в мае. Apple также работает над большой языковой моделью для Siri, однако её выпуск был отложен — по словам старшего вице-президента Apple по программному обеспечению Крейга Федериги (Craig Federighi), компания пока не достигла «желаемого уровня надёжности».

Google отмечает, что Search Live может работать в фоновом режиме, позволяя продолжать диалог с чат-ботом даже при переходе в другие приложения. Пользователь может также включить субтитры, чтобы видеть текстовую версию ответа, и при желании продолжить общение текстом. Кроме того, Search Live сохраняет историю прошлых разговоров в разделе поиска AI Mode.

ИИ-приложение Google Gemini научилось анализировать видео, но не везде

Помимо выпуска стабильных версий ИИ-моделей Gemini 2.5 Pro и Gemini 2.5 Flash, разработчики Google добавили в мобильное приложение чат-бота Gemini возможность загрузки и анализа видео, сообщил ресурс 9to5Google.

 Источник изображений: 9to5Google

Источник изображений: 9to5Google

Теперь, помимо загрузки документов и изображений, пользователи могут добавлять в запрос в приложении собственный видеофайл. ИИ-чат-бот Gemini проанализирует его и позволит пользователям задавать вопросы о клипе. Ранее пользователи имели возможность задавать вопросы только по поводу видео на платформе YouTube, указав ссылку на него.

9to5Google приводит примеры диалога с Gemini, в ходе которого чат-бот отвечает на вопрос о времени, которое указано на умном дисплее Google Nest Hub, а также в ответ на запрос предоставляет описание видеоролика, который загрузил пользователь.

Чтобы загрузить файл, необходимо в меню выбрать «Галерея» или «Файлы». «Если эта возможность доступна для вашей учетной записи, вы можете выбрать видео. В противном случае файл будет серым и не может быть загружен», — пишет 9to5Google.

Ресурс отметил, что функция загрузки видео в Gemini пока не получила широкого распространения, хотя она, похоже, доступна как для бесплатных, так и для платных аккаунтов на Android (приложение Google 16.23 beta) и iOS, а также 2.5 Flash и 2.5 Pro. Вместе с тем в веб-приложении эта функция пока не доступна — при попытке загрузить видео в строке подсказок чат-бота появляется сообщение «Тип файла не поддерживается».

Google выпустила финальную версию мощной ИИ-модели Gemini 2.5 Pro, а также экономную Gemini 2.5 Flash-Lite

Google объявила о выходе стабильных версий своих ИИ-моделей Gemini 2.5 Pro и Gemini 2.5 Flash, а также представила новую бюджетную модификацию — Gemini 2.5 Flash-Lite. Основные обновления направлены на снижение затрат для разработчиков и повышение стабильности моделей. Высокопроизводительная Gemini 2.5 Pro вышла из стадии превью и готова к коммерческому использованию.

 Источник изображения: Ryan Whitwam / arstechnica.com

Источник изображения: Ryan Whitwam / arstechnica.com

Модель Gemini 2.5 была представлена в начале 2025 года и продемонстрировала значительный прогресс по сравнению с предыдущими версиями, усилив конкуренцию Google с OpenAI. Gemini 2.5 Flash вышла из стадии предварительного просмотра ещё в апреле, однако Gemini 2.5 Pro немного задержалась. Сейчас обе модели, включая обновлённую сборку 06-05 для Pro-версии, доступны в стабильной версии.

Все модели линейки Gemini 2.5 поддерживают настраиваемый бюджет ответов ИИ, позволяя разработчикам контролировать свои расходы. В наиболее экономичном варианте Google предлагает облегчённую модель Gemini 2.5 Flash-Lite, которая сейчас находится в статусе Preview. По сравнению с версией 2.5 Flash, стоимость обработки текста, изображений и видео будет в три раза ниже, а генерация ответов — более чем в шесть раз дешевле. Flash-Lite не будет представлена в пользовательском приложении Gemini, так как ориентирована в первую очередь на разработчиков, оплачивающих использование модели по количеству токенов.

 Источник изображения: Google

Источник изображения: Google

Кроме того, Google начала внедрять модели Flash и Flash-Lite в свою поисковую систему. Представитель компании сообщил изданию Ars Technica, что адаптированные версии этих моделей уже используются в «ИИ-обзорах» и в режиме чат-бота AI Mode. В зависимости от сложности запроса система автоматически выбирает оптимальную модель: Gemini 2.5 Pro — для сложных задач, Flash или Flash-Lite — для более простых.

Предварительная версия Flash-Lite доступна через Google AI Studio и Vertex AI для разработчиков наряду со стабильными релизами Gemini 2.5 Flash и 2.5 Pro. В пользовательском приложении Gemini заметных изменений не произойдёт, поскольку финальные версии моделей уже были задействованы в предыдущих обновлениях. У версии 2.5 Pro исчезнет метка Preview — так же, как месяцем ранее это произошло с моделью Flash. Бесплатные пользователи по-прежнему будут иметь ограниченный доступ к 2.5 Pro, тогда как подписчики Gemini Pro смогут использовать модель до 100 раз в сутки. Максимальный уровень доступа остаётся у владельцев подписки AI Ultra.

Google Gemini научился выполнять задачи по расписанию

Google продолжает расширять возможности ИИ-ассистента Gemini, добавив функцию запланированных действий. Теперь подписчики Gemini Pro и Ultra могут настраивать автоматическое выполнение задач в заданное время. Например, ИИ будет отправлять сводку календаря в конце дня или предлагать идеи для блога еженедельно.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Как сообщает The Verge, пользователи также смогут поручать Gemini разовые задания. Например, запрашивать итоги прошедшего мероприятия на следующий день. Для работы функции достаточно указать искусственному интеллекту, что и когда нужно сделать, а чат-бот выполнит задачу самостоятельно. Управлять запланированными действиями можно в настройках приложения Gemini на странице Scheduled Actions.

Ранее издание Android Authority сообщило, что предварительная версия этой функции была замечена ещё в апреле. Обновление является частью масштабных планов Google по превращению Gemini в цифрового помощника, обладающего более широкими автономными возможностями и способного выполнять команды без вмешательства пользователя. Интересно, что аналогичную функцию уже предлагает OpenAI в ChatGPT. В частности, подписчики могут настраивать «напоминалки» и повторяющиеся задачи.

Google навела порядок в Gemini 2.5 Pro — исправлены накопившиеся у ИИ-модели «регрессии»

Google выпустила крупное обновление своей самой мощной модели искусственного интеллекта Gemini 2.5 Pro. Свежий вариант призван исправить некоторые проблемы, возникшие в более ранних версиях, — компания намеревается установить для него статус стабильного, то есть он будет подключён к приложению Gemini как основной для широкой аудитории.

 Источник изображений: blog.google

Источник изображений: blog.google

Предыдущий выпуск Gemini 2.5 Pro с номером версии 05-06 и именем I/O Edition был направлен на повышение качества генерируемого ИИ программного кода. В последнем обновлении, утверждает Google, этот навык был дополнительно улучшен, и в тесте Aider Polyglot модель набрала 82,2 %, значительно оторвавшись от лучших моделей OpenAI, Anthropic и DeepSeek.

Модель Gemini 2.5 Flash уже вышла из стадии предварительной и стала стабильной, тогда как работа над Gemini 2.5 Pro продолжается — несколько последних её обновлений спровоцировали критику по качеству ответов на запросы, не связанные с написанием кода, — их качество снизилось по сравнению с крупным выпуском версии 03-25. Google приняла эти замечания всерьёз, заявили в компании, и в свежем обновлении «закрыты проблемы в регрессиях [относительно] 03-25». Пользователям обещаны улучшенные творческие способности модели и более качественное форматирование ответов.

 Источник изображений: blog.google

Последнее обновление Gemini 2.5 Pro 06-05 поддерживает гибкое управление ресурсами модели для разработчиков, и в Google рассчитывают, что эта сборка получит статус «долгосрочного стабильного выпуска». Таким образом, если в ближайшие недели данный вариант выйдет в приложении для широкой аудитории и в веб-интерфейсе, у Gemini 2.5 Pro уже не будет статуса предварительной версии (Preview).

Google традиционно собирает оценки качества ответов своих моделей и приводит рейтинги с платформ LMArena и WebDevArena, где сравниваются возможности различных систем ИИ. На платформе LMArena модель увеличила результат на 24 балла по системе Эло, и на 35 балов он вырос на WebDevArena. Модели ИИ от Google были на вершинах обоих рейтингов и до настоящего момента, поэтому с выходом очередного обновления разрыв только увеличился. Опробовать последнюю версию Gemini 2.5 Pro можно на облачных платформах Google Cloud Vertex AI и AI Studio, а также в приложении Gemini.

Google научила Gemini 2.5 понимать и передавать эмоции в диалогах

На конференции Google I/O 2025 компания анонсировала новую версию своей мультимодальной модели Gemini 2.5, которая теперь поддерживает генерацию аудио и диалогов в реальном времени. Эти возможности доступны в предварительной версии для разработчиков через платформы Google AI Studio и Vertex AI.

 Источник изображения: Google

Источник изображения: Google

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие с ИИ, включая распознавание эмоциональной окраски речи, адаптацию интонации и акцента, а также возможность переключения между более чем 24 языками. Модель может игнорировать фоновые шумы и использовать внешние инструменты, такие как «Поиск», для получения актуальной информации во время диалога.

Дополнительно, Gemini 2.5 предлагает расширенные функции синтеза речи (TTS), позволяя управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что делает модель подходящей для создания подкастов, аудиокниг и других мультимедийных продуктов.

Для обеспечения прозрачности, все сгенерированные моделью аудио маркируются с помощью технологии SynthID, что позволяет идентифицировать контент, как сгенерированный ИИ. Разработчики могут опробовать новые функции через вкладки Stream и Generate Media в Google AI Studio.

Gemini 2.5 демонстрирует значительный шаг вперёд в области мультимодальных ИИ-систем, объединяя модальности текстов, изображений, аудио и видео в единую платформу. Новые функции открывают широкие перспективы для создания интерактивных приложений, виртуальных ассистентов и инноваций в сфере образования.


window-new
Soft
Hard
Тренды 🔥
«Жидкое стекло» Apple можно будет заматировать: представлена нова бета iOS 26.1 12 мин.
Сервисы AWS упали второй раз за день — тысячи сайтов по всему миру снова недоступны 8 ч.
Fujitsu влила £280 млн в британское подразделение в преддверии выплат компенсаций жертвам багов в её ПО Horizon 8 ч.
Календарь релизов 20 – 26 октября: Ninja Gaiden 4, Painkiller, Dispatch и VTM – Bloodlines 2 8 ч.
В Windows сломалась аутентификация по смарт-картам после октябрьских обновлений — у Microsoft есть временное решение 9 ч.
Вместо Majesty 3: российские разработчики выпустили в Steam амбициозную фэнтезийную стратегию Lessaria: Fantasy Kingdom Sim 9 ч.
Слухи: Лана Дель Рей исполнит заглавную песню для «Джеймса Бонда», но не в кино, а в игре от создателей Hitman 10 ч.
Зов сердца: разработчики Dead Cells объяснили, почему вместо Dead Cells 2 выпустили Windblown 11 ч.
Adobe запустила фабрику ИИ-моделей, заточенных под конкретный бизнес 11 ч.
Китай обвинил США в кибератаках на Национальный центр службы времени — это угроза сетям связи, финансовым системам и не только 12 ч.
Президент США подписал соглашение с Австралией на поставку критически важных минералов на сумму $8,5 млрд 18 мин.
Новая статья: Обзор смартфона realme 15 Pro: светит, но не греется 5 ч.
Ещё одна альтернатива платформам NVIDIA — IBM объединила усилия с Groq 5 ч.
Учёные создали кибер-глаз, частично возвращающий зрение слепым людям 6 ч.
Samsung выпустила недорогой 27-дюймовый геймерский монитор Odyssey OLED G50SF c QD-OLED, 1440p и 180 Гц 6 ч.
Акции Apple обновили исторический максимум на новостях об отличных продажах iPhone 17 8 ч.
Представлен флагман iQOO 15 с чипом Snapdragon 8 Elite Gen 5 и батареей на 7000 мА·ч по цене меньше $600 9 ч.
Нечто из космоса врезалось в лобовое стекло самолёта Boeing 737 MAX компании United Airlines 10 ч.
Умные кольца Oura научатся выявлять признаки гипертонии, как последние Apple Watch 11 ч.
Дешёвая корейская термопаста оказалась вредна для процессоров и здоровья пользователей 11 ч.