Сегодня 14 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → google gemini
Быстрый переход

Google Gemini научился выполнять задачи по расписанию

Google продолжает расширять возможности ИИ-ассистента Gemini, добавив функцию запланированных действий. Теперь подписчики Gemini Pro и Ultra могут настраивать автоматическое выполнение задач в заданное время. Например, ИИ будет отправлять сводку календаря в конце дня или предлагать идеи для блога еженедельно.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Как сообщает The Verge, пользователи также смогут поручать Gemini разовые задания. Например, запрашивать итоги прошедшего мероприятия на следующий день. Для работы функции достаточно указать искусственному интеллекту, что и когда нужно сделать, а чат-бот выполнит задачу самостоятельно. Управлять запланированными действиями можно в настройках приложения Gemini на странице Scheduled Actions.

Ранее издание Android Authority сообщило, что предварительная версия этой функции была замечена ещё в апреле. Обновление является частью масштабных планов Google по превращению Gemini в цифрового помощника, обладающего более широкими автономными возможностями и способного выполнять команды без вмешательства пользователя. Интересно, что аналогичную функцию уже предлагает OpenAI в ChatGPT. В частности, подписчики могут настраивать «напоминалки» и повторяющиеся задачи.

Google навела порядок в Gemini 2.5 Pro — исправлены накопившиеся у ИИ-модели «регрессии»

Google выпустила крупное обновление своей самой мощной модели искусственного интеллекта Gemini 2.5 Pro. Свежий вариант призван исправить некоторые проблемы, возникшие в более ранних версиях, — компания намеревается установить для него статус стабильного, то есть он будет подключён к приложению Gemini как основной для широкой аудитории.

 Источник изображений: blog.google

Источник изображений: blog.google

Предыдущий выпуск Gemini 2.5 Pro с номером версии 05-06 и именем I/O Edition был направлен на повышение качества генерируемого ИИ программного кода. В последнем обновлении, утверждает Google, этот навык был дополнительно улучшен, и в тесте Aider Polyglot модель набрала 82,2 %, значительно оторвавшись от лучших моделей OpenAI, Anthropic и DeepSeek.

Модель Gemini 2.5 Flash уже вышла из стадии предварительной и стала стабильной, тогда как работа над Gemini 2.5 Pro продолжается — несколько последних её обновлений спровоцировали критику по качеству ответов на запросы, не связанные с написанием кода, — их качество снизилось по сравнению с крупным выпуском версии 03-25. Google приняла эти замечания всерьёз, заявили в компании, и в свежем обновлении «закрыты проблемы в регрессиях [относительно] 03-25». Пользователям обещаны улучшенные творческие способности модели и более качественное форматирование ответов.

 Источник изображений: blog.google

Последнее обновление Gemini 2.5 Pro 06-05 поддерживает гибкое управление ресурсами модели для разработчиков, и в Google рассчитывают, что эта сборка получит статус «долгосрочного стабильного выпуска». Таким образом, если в ближайшие недели данный вариант выйдет в приложении для широкой аудитории и в веб-интерфейсе, у Gemini 2.5 Pro уже не будет статуса предварительной версии (Preview).

Google традиционно собирает оценки качества ответов своих моделей и приводит рейтинги с платформ LMArena и WebDevArena, где сравниваются возможности различных систем ИИ. На платформе LMArena модель увеличила результат на 24 балла по системе Эло, и на 35 балов он вырос на WebDevArena. Модели ИИ от Google были на вершинах обоих рейтингов и до настоящего момента, поэтому с выходом очередного обновления разрыв только увеличился. Опробовать последнюю версию Gemini 2.5 Pro можно на облачных платформах Google Cloud Vertex AI и AI Studio, а также в приложении Gemini.

Google научила Gemini 2.5 понимать и передавать эмоции в диалогах

На конференции Google I/O 2025 компания анонсировала новую версию своей мультимодальной модели Gemini 2.5, которая теперь поддерживает генерацию аудио и диалогов в реальном времени. Эти возможности доступны в предварительной версии для разработчиков через платформы Google AI Studio и Vertex AI.

 Источник изображения: Google

Источник изображения: Google

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие с ИИ, включая распознавание эмоциональной окраски речи, адаптацию интонации и акцента, а также возможность переключения между более чем 24 языками. Модель может игнорировать фоновые шумы и использовать внешние инструменты, такие как «Поиск», для получения актуальной информации во время диалога.

Дополнительно, Gemini 2.5 предлагает расширенные функции синтеза речи (TTS), позволяя управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что делает модель подходящей для создания подкастов, аудиокниг и других мультимедийных продуктов.

Для обеспечения прозрачности, все сгенерированные моделью аудио маркируются с помощью технологии SynthID, что позволяет идентифицировать контент, как сгенерированный ИИ. Разработчики могут опробовать новые функции через вкладки Stream и Generate Media в Google AI Studio.

Gemini 2.5 демонстрирует значительный шаг вперёд в области мультимодальных ИИ-систем, объединяя модальности текстов, изображений, аудио и видео в единую платформу. Новые функции открывают широкие перспективы для создания интерактивных приложений, виртуальных ассистентов и инноваций в сфере образования.

В Google разработали инструмент для выявления контента, сгенерированного ИИ

Компания Google анонсировала на конференции Google I/O новый инструмент SynthID Detector, который позволяет узнать, был ли контент создан с помощью инструментов искусственного интеллекта. Сервис анализирует изображения, текст, аудио и видео на наличие скрытых водяных меток, которые автоматически добавляются в материалы, сгенерированные с помощью ИИ, включая модели компании — Gemini, Imagen, Lyria и Veo.

 Источник изображения: Sascha Bosshard / Unsplash

Источник изображения: Sascha Bosshard / Unsplash

Как объяснил руководитель Google DeepMind Пушмит Коли (Pushmeet Kohli), система определяет, какие именно части контента содержат маркировку. Например, в аудио SynthID Detector находит и отмечает конкретные временные отрезки, а в изображениях — области с наибольшей вероятностью наличия водяного знака.

Сейчас система тестируется среди ограниченного круга пользователей. Но после первого этапа тестирования доступ постепенно получат те, кто подал заявку через «Лист ожидания» (SynthID Detector Waitlist). По словам Коли, компания планирует также использовать обратную связь с пользователями, чтобы улучшить систему идентификации ИИ-контента.

На данный момент SynthID Detector работает только с контентом, созданным с помощью продуктов Google. Однако в будущем компания рассматривает возможность расширения функциональности для работы с другими ИИ-системами. Когда именно инструмент станет доступен всем — пока неизвестно.

Google добавила в Gmail, «Документы» и Vids новые ИИ-функции

На конференции Google I/O 2025 компания представила множество новых функций на основе искусственного интеллекта для приложений из рабочего комплекта Workspace — изменения коснулись сервисов Gmail, «Google Документы» и видеоредактора Google Vids.

 Источник изображений: Google

Источник изображений: Google

Функция персонализированных интеллектуальных ответов Gmail помогает в составлении писем с учётом контекста и тона — система анализирует предыдущую переписку, файлы в облачном хранилище «Google Диск» и готовит ответы с актуальными данными. Манера письма подстраивается под тон пользователя — формальный или разговорный. С функцией очистки входящих сообщений ИИ-помощник Gemini принимает решения об удалении или перемещении в архив писем, которые больше не нужны — достаточно, например, в свободной форме дать ему команду удалить все непрочитанные письма от определённого адресата за минувший год.

Ещё одна новая возможность Gmail помогает оперативно планировать встречи и совещания с адресатами вне организации пользователя. Он назначает время встречи или совещания при участии Gemini — это, по словам Google, сокращает время и усилия, которые традиционно тратятся на сверку расписаний. Все эти новые функции почтовой службы станут общедоступными в ближайшие месяцы.

 Источник изображений: Google

В «Google Документах» появилась возможность устанавливать прямую связь приложения с данными презентаций, таблиц и отчётов — помогая в написании документов, Gemini берёт в качестве исходной информации только эти источники, то есть генерируемый системой текст основывается только на надёжном материале. Функция уже вышла в общий доступ.

Редактор Google Vids получил возможность превращать существующие документы «Google Презентаций» в видео. Gemini предлагает помощь в составлении сценариев, может сгенерировать закадровый голос, анимации и многое другое — функция станет общедоступной в ближайшие месяцы. В Google Vids появились ИИ-аватары, которые пригодятся компаниям, не располагающими средствами для съёмки видео или привлечения диктора. Можно подготовить сценарий и выбрать аватар, который зачитает сообщение в специально подготовленном видео — это пригодится для корпоративных объявлений, создании справки по продуктам и в других целях. ИИ-аватары выйдут в общий доступ в июне.

Ещё одна новая функция Google Vids — «Обрезка стенограммы» (Transcript trim), предполагающая автоматическое удаление из выступлений слов-паразитов и лишних междометий. Для регулирования уровня звука пригодится функция «Сбалансировать звук» (Balance sound) — она выйдет в общий доступ в июне; «Обрезка стенограммы» появится в экспериментальном разделе Labs в ближайшие месяцы. Наконец, более качественные иллюстрации в документах теперь помогает создавать новая версия генератора изображений Imagen 4, доступ к которой открылся в рабочих приложениях.

Google анонсировала запуск AI Mode — ИИ-поиск будущего с анализом данных, графиками и 3D-примеркой

Google объявила о масштабном запуске расширенного поиска с ИИ AI Mode, который позволяет задавать сложные, многоуровневые вопросы и получать развёрнутые ответы с анализом данных. Функция начнёт появляться у пользователей в США, а затем станет доступна во всём мире.

 Источник изображения: Google

Источник изображений: Google

AI Mode строится на основе существующего инструмента AI Overviews, который показывает краткие ИИ-сводки в начале поисковой выдачи. Несмотря на отдельные казусы прошлого, например, совет использовать клей вместо соуса для пиццы, этот формат быстро набрал популярность. По статистике им ежемесячно пользуются более 1,5 миллиарда человек. Как отмечает TechCrunch, теперь AI Overviews выйдет из тестового режима, расширится на 200 стран и получит поддержку более 40 языков.

Новый AI Mode предназначен для сложных запросов, включая сравнение товаров и анализ данных. Он использует технологию Deep Search, которая разбивает вопрос на подтемы и обрабатывает десятки, а то и сотни запросов, чтобы сформировать детальный отчёт со ссылками на источники. Google утверждает, что это реально экономит часы ручного поиска.

Также анонсирован автоматический помощник для покупок, который сможет отслеживать цену на товар и, в случае снижения, уведомить о возможности покупки. Ещё появится функция виртуальной примерки одежды. Пользователи смогут загружать свои фото, а ИИ будет «надевать» на них выбранные вещи в 3D-формате, учитывая комплекцию человека и тип ткани одежды. Функция начнёт тестироваться в Search Labs с сегодняшнего дня.

Для обработки информации в AI Mode и AI Overviews используется специальная версия модели Gemini 2.5. В будущем часть функций AI Mode постепенно перейдёт и в AI Overviews. Пользователи смогут задавать вопросы, например, из сферы спорта и финансов, и получать в ответ не просто цифры, а визуализированные графики и таблицы.

Ещё одно нововведение касается интеграции ИИ-агента Project Mariner, который может самостоятельно бронировать билеты, столики в ресторанах и находить в интернете различные мероприятия. А позднее выйдет Search Live — «Живой поиск» — с помощью которого пользователи смогут задавать вопросы посредством камеры смартфона, а ИИ будет отвечать в реальном режиме времени подобно системе мультимодального ИИ-помощника Project Astra.

Также будет усилена персонализация. Если подключить Gmail (или другой сервис Google), поисковик будет учитывать предпочтения пользователя и предлагать результаты на основе писем электронной почты. При этом пользователь сам решает, какие приложения подключать, а какие — нет.

Google мощно обновила приложение Gemini: изучение мира в реальном времени, улучшенный Deep Research и многое другое

Google рассказала на конференции Google I/O 2025 о новых возможностях чат-бота Gemini с искусственным интеллектом: расширились мультимодальные функции платформы, открылся доступ к новым моделям ИИ, готовится глубокая интеграция с сервисами Google.

 Источник изображений: blog.google

Источник изображений: blog.google

В очередном обновлении приложения расширились функции Gemini Live для всех её пользователей под Google Android и Apple iOS. Теперь можно беседовать с Gemini в режиме, близком к реальному времени, одновременно транслируя ИИ видео с камеры или экрана смартфона. Во время прогулки по незнакомому городу можно направить камеру телефона на одно из зданий и спросить у Gemini Live о его архитектуре или истории — ИИ-помощник даст ответ почти без задержки. В ближайшие недели начнётся процесс глубокой интеграции Gemini Live с другими приложениями: чат-бот сможет составлять маршруты в «Google Картах», создавать события в «Google Календаре» и списки дел в «Google Задачах».

Google активно расширяет возможности Gemini из-за конкурентов, в том числе OpenAI ChatGPT, Apple Siri и других помощников с ИИ. Число чат-ботов постоянно растёт, появляются новые способы взаимодействия с гаджетами и интернетом — под давлением оказываются и продукты крупных компаний, такие как «Google Поиск» и «Google Ассистент». Сегодня, сообщила Google, у Gemini уже 400 млн активных пользователей в месяц, и новые возможности платформы призваны расширить её аудиторию.

Компания представила два тарифных плана подписки на ИИ: Gemini Advanced теперь называется Google AI Pro при той же цене $20 в месяц; в дополнение к ней появилась Google AI Ultra за $250 в месяц — прямой конкурент ChatGPT Pro. Подписчикам Google AI Ultra доступны расширенные лимиты сервисов, они первыми смогут опробовать новые модели и эксклюзивно воспользоваться определёнными функциями. Американские подписчики Pro и Ultra, у которых в Chrome в качестве основного выбран английский язык, получат доступ к Gemini прямо в браузере — ИИ будет составлять сводки информации на страницах и отвечать на вопросы о том, что выведено на экран.

 Источник изображений: blog.google

Расширились возможности агента искусственного интеллекта Gemini Deep Research, который составляет подробные исследовательские отчёты для пользователей — теперь он поддерживает загрузку файлов PDF и изображений. Для составления более персонализированных отчётов он может, например, сверять эти личные файлы PDF с общедоступными данными; на подходе — прямая интеграция Deep Research с Gmail и «Google Диском».

Пользователям бесплатного варианта Gemini открыли доступ к обновлённой модели генерации изображений Imagen 4 — она, по словам Google, более качественно выводит текст. Подписчики Google AI Ultra за $250 в месяц смогут поработать с новейшим генератором видео Veo 3, который в дополнение к изображению теперь генерирует ещё и синхронизированный с картинкой звук. Моделью по умолчанию в Gemini стала Gemini 2.5 Flash — она по сравнению с предшественницей даёт более качественные ответы с меньшей задержкой. Для школьников и студентов Gemini теперь создаёт персонализированные тесты по дисциплинам, которые те хотят более плотно изучить — когда пользователь даёт неправильные ответы, ИИ составляет план действий и генерирует дополнительные тесты, чтобы укрепить знания пользователей в этих областях.

Google обновила фирменный значок «G» впервые за 10 лет — теперь он градиентный

Предыдущее обновление фирменного стиля Google произошло почти 10 лет назад — 1 сентября 2015 года компания изменила свой логотип, выбрав для его написания шрифт Product Sans. В результате изменений значок из маленькой белой буквы «g» на синем фоне превратился в четырёхцветную заглавную «G», которая без изменений олицетворяла собой Google до сегодняшнего дня. Теперь компания освежила этот логотип, заменив четыре сплошные цветные секции на плавный радужный градиент.

 Источник изображения: Google

Источник изображения: Google

Отныне в значке Google красный плавно переходит в жёлтый, жёлтый в зелёный, а зелёный в синий. По мнению представителей компании, новый вариант выглядит более современным, ярким и красочным. Эта модернизация значка приближает его к градиентному логотипу Gemini, похожий ярлык уже используется для вызова режима искусственного интеллекта в поиске.

В настоящее время новый значок уже используется приложением «Поиск Google» для iOS. В принципе, это довольно незначительное изменение, которое многие пользователи могут просто не заметить.

Похоже, что Google пока не намерена менять свой основной шестибуквенный логотип, в то время как значки многих приложений, скорее всего, могут получить аналогичные градиентные заливки.

Google совсем скоро представит мобильные приложения ИИ-блокнота NotebookLM с офлайн-режимом

20 мая, в день старта конференции Google I/O 2025, дебютируют бета-версии нативных мобильных приложений NotebookLM для iOS и Android, которые придут на смену существующему веб-приложению. Они обеспечат интеграцию ИИ-сервиса с системными функциями мобильных устройств. Приложения будут поддерживать полноценный офлайн-доступ к ранее сгенерированным аудиообзорам, что позволит слушать материалы при отсутствии подключения к интернету. Таким образом, NotebookLM станет по-настоящему мобильным ИИ-инструментом для учёбы, анализа и создания персонализированного контента на ходу.

 Источник изображений: Google

Источник изображений: Google

NotebookLM — это исследовательский инструмент на основе ИИ, вышедший в 2023 году в формате PWA. Несмотря на его широкую функциональность, использование через браузер накладывало свои ограничения: невозможность работы при потере интернет-соединения и отсутствие полноценного фонового воспроизведения аудио. Новые мобильные приложения призваны устранить оба этих недостатка.

Сервис часто описывают как «умный блокнот» нового поколения: пользователи могут загружать в него PDF-файлы, статьи, ссылки на общедоступные видео с YouTube, обычный текст, Google Документы, Google Презентации, аудиофайлы и другие источники информации. ИИ анализирует материалы, выделяет ключевые положения, отвечает на тематические вопросы, а также способен автоматически преобразовывать контент в формат краткого аудиообзора — своеобразного подкаста, созданного по содержанию загруженных данных.

NotebookLM использует новейшие ИИ-модели семейства Gemini. Все ответы сопровождаются ссылками на источники, что позволяет точно видеть, какая информация была извлечена ИИ из загруженных материалов. Благодаря такой достоверности сервис становится незаменимым помощником для студентов, аналитиков, исследователей и всех, кому необходим точный и проверяемый фактологический материал.

Функциональность включает полноценный офлайн-режим. Можно заранее скачать аудиообзоры, созданные ИИ, и прослушивать их без подключения к интернету. Благодаря фоновому воспроизведению, аудио продолжает играть, даже если пользователь переключился на другое приложение или заблокировал экран.

 Источник изображений: Google

Судя по скриншотам из Google «Play Маркет», интерфейс приложения будет содержать ряд дополнительных функций, часть из которых знакома пользователям веб-версии:

  • Главный экран (Home screen). Отображаются вкладки «Недавние» (Recent), «Общие» (Shared), «Название» (Title) и «Загруженные» (Downloaded), а также прокручиваемый список тетрадей. Каждая тетрадь имеет большую кнопку для запуска «Аудиообзора» (Audio Overview).
  • Аудиоплеер (Audio player): Это полноэкранный режим, который не только показывает анимированную форму волны, но и позволяет вам «присоединиться к подкасту», чтобы задать ИИ вопросы или получить пояснения.
  • Создание новой тетради. Большая плавающая кнопка действия в нижней части экрана позволяет создать новую тетрадь. Достаточно нажать на неё, чтобы загрузить документы, вставить текст, добавить URL-адреса — или воспользоваться функцией системного общего доступа, чтобы импортировать содержимое из других приложений непосредственно в NotebookLM.
  • Режим просмотра тетради. При открытии тетради в нижней части экрана отображается постоянная панель инструментов, обеспечивающая быстрый доступ к разделу «Источники» (Sources) (просмотр загруженных материалов), «Чат» (Chat) (взаимодействие с ИИ по содержанию тетради) и «Студия» (Studio) (настройки и статистика использования).

Скриншоты также демонстрируют, как приложение выглядит на планшетах: в режиме разделённого экрана чат с ИИ располагается рядом со списком источников — как при работе на ноутбуке.

 Источник изображений: Google

Нативные приложения обеспечивают более глубокую интеграцию с системами iOS и Android и доступ к системным функциям, таким как push-уведомления. Пользователи смогут получить доступ к новому приложению, выполнив следующие действия:

  1. Предварительная регистрация: Зайдите в Apple App Store или Google «Play Маркет» нажмите «Предзаказ» (Pre-order) или «Предварительная регистрация» (Pre-register).
  2. Автоматическая загрузка: 20 мая (в первый день Google I/O 2025) ваш смартфон автоматически загрузит приложение.
  3. Войти: Откройте приложение, войдите в него с помощью учетной записи Google, и всё готово.
  4. Обновите приложение до NotebookLM Plus (по желанию): Не забывайте, что существует приложение NotebookLM Plus, доступное в Google One AI Premium. В нём есть всё, что предлагает NotebookLM, плюс в 5 раз больше аудиообзоров, запросов и источников для каждого блокнота, возможность настраивать стиль и длину ответов в блокноте, а также возможность делиться блокнотами с командой.

Google откроет Gemini доступ ко всей информации о пользователях, которую она накопила

Гонка чат-ботов с искусственным интеллектом накаляется, и теперь Google собирается дать Gemini возможность понять пользователя как, возможно, никто другой. Gemini сможет не только запоминать предыдущие разговоры с человеком, но также учиться на его действиях в других приложениях: Gmail, «Google Календарь» и YouTube, сообщил президент Google Labs и Gemini Джош Вудворд (Josh Woodward).

 Источник изображения: blog.google

Источник изображения: blog.google

В апреле OpenAI объявила, что значительно расширит память ChatGPT, позволит помощнику обращаться к прошлой переписке с пользователем и использовать эту информацию для персонализации последующих ответов. Такие ответы, по мнению компании, будут в большей степени соответствовать его интересам, привычкам и предпочтениям, обеспечивая более комфортное и полезное взаимодействие.

В Google решили на этом не останавливаться. В ближайшее время компания откроет Gemini доступ к истории прошлых чатов пользователя и ИИ, а после этого развернёт функцию pcontext, что означает «персонализированный контекст». Пока эта функция тестируется внутри компании. Она предназначена для извлечения информации из учётной записи пользователя в экосистеме Google, что обеспечит Gemini глубокое понимание жизни пользователя: упоминаются, в частности, Gmail, «Google Фото», «Google Календарь», «Google Поиск» и YouTube. Компания намеревается сделать Gemini более активным, но не уточнила, что именно имеется в виду. Возможно, помощник с ИИ будет по собственной инициативе выдвигать полезные предложения с учётом расписания, истории веб-поиска и активности в почтовом ящике пользователя.

Настолько глубокая интеграция, конечно, поднимает вопрос о конфиденциальности. Google и без того хранит чрезвычайно много информации о пользователях, а открытие её системе ИИ и возможность совершать операции с этими данными — очередной шаг вперёд. Поэтому в компании заверили, что будут запрашивать у пользователей явное разрешение, прежде чем Gemini получит доступ к этим данным. Это шаг к тому, чтобы сделать Gemini более «личным, проактивным и мощным», уверен господин Вудворд. И намекнул, что скоро появится новая информация.

Google научила ИИ-бота Gemini редактировать любые изображения

Google Gemini научился редактировать как сгенерированные ИИ изображения, так и загруженные со смартфона или компьютера. В ближайшие недели новая функциональность станет доступна пользователям в большинстве стран мира, где доступен Gemini, и получит поддержку более чем 45 языков. Россия, напомним, в этот список не входит, однако русский язык Gemini понимает и «говорит» на нём.

 Источник изображений: Google

Источник изображений: Google

Нативное редактирование изображений в ИИ-чат-боте Gemini представляет собой эволюционный шаг в развитии возможностей взаимодействия пользователя с ИИ. Запуск последовал за моделью редактирования изображений с помощью ИИ, которую Google опробовала в марте в своей платформе AI Studio и которая получила широкую огласку благодаря своей спорной способности удалять водяные знаки с любого изображения. Подобно недавно обновлённому инструменту редактирования изображений в ChatGPT, встроенный редактор Gemini теоретически способен достигать более высоких результатов по сравнению с автономными ИИ-генераторами изображений.

Теперь Gemini предлагает инновационный «многоэтапный» процесс редактирования, обеспечивающий, по описанию компании, «более богатые и контекстуальные» отклики на каждый запрос — с интеграцией текста и изображений. Функциональность нового редактора позволяет пользователям изменять фон на изображениях, заменять объекты, добавлять элементы и выполнять множество других операций — и всё это непосредственно в интерфейсе Gemini. Подобное решение существенно упрощает процесс создания и редактирования визуального контента, устраняя необходимость переключаться между несколькими специализированными приложениями.

 Источник изображений: Google

«Например, вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос. Также можно попросить Gemini создать первый черновик сказки на ночь о драконах и сгенерировать иллюстрации к истории», — поясняет Google в своём блоге. Эти примеры наглядно демонстрируют многофункциональность системы, пригодной как для утилитарных, так и для креативных задач.

Потенциальные риски технологии в контексте создания дипфейков обоснованно вызывают опасения у специалистов по информационной безопасности. Чтобы нивелировать возможные злоупотребления, Google внедряет технологию невидимых водяных знаков во все изображения, созданные или отредактированные с помощью нативного генератора изображений Gemini. Параллельно компания проводит экспериментальные исследования по внедрению видимых водяных знаков на всех изображениях, сгенерированных с помощью Gemini.

Google подтвердила, что близка к внедрению ИИ-модели Gemini в iPhone

Генеральный директор Google Сундар Пичаи (Sundar Pichai) заявил, что компания близка к соглашению с Apple о внедрении модели искусственного интеллекта Gemini в iPhone. Это позволит Siri использовать широкие возможности ИИ-модели для ответов на более сложные вопросы.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Ещё в июне прошлого года старший вице-президент Apple Крейг Федериги (Craig Federighi) намекал на возможность интеграции, говоря, что компания хотела бы, чтобы в будущем у пользователей была возможность выбора между ИИ-моделями, включая Google Gemini. В настоящий момент добавлена только поддержка чат-бота от OpenAI в систему Apple Intelligence, которая перенаправляет сложные запросы в ChatGPT, если они выходят за рамки её возможностей, отмечает The Verge.

Пичаи подтвердил, что обсуждал вопрос интеграции с главой Apple Тимом Куком (Tim Cook), а он, в свою очередь, интересовался планами разработки и продвижения Gemini, и также подтвердил, что его компания намерена добавить уже в этом году в Apple Intelligence больше сторонних ИИ-моделей.

Если сделка состоится (предположительно к концу 2025 года), Gemini станет второй сторонней ИИ-системой, доступной в экосистеме Apple, и даст пользователям возможность выбора между технологиями OpenAI и Google, а также усилит конкуренцию в области искусственного интеллекта.

Google Gemini поможет в практике иностранных языков — есть и поддержка русского

Google выпустила три экспериментальных проекта на основе технологий искусственного интеллекта, предназначенные для помощи пользователям в изучении иностранных языков. Разработка решений находится на ранних этапах, но большая языковая модель Gemini уже сейчас становится грозным конкурентом Duolingo.

 Источник изображений: googleblog.com

Источник изображений: googleblog.com

Первый экспериментальный проект направлен на быстрое изучение определённых фраз, которые нужны пользователю в данный момент; второй предназначен для того, чтобы сформировать у обучаемого менее формальные навыки иностранного языка и выработать у него манеру общения, более свойственную местным жителям. Третий экспериментальный проект предполагает подключение камеры для формирования нового лексикона на основе окружающих предметов.

Один из наиболее неприятных аспектов при изучении иностранного языка, отмечают в Google, — оказаться в ситуации, когда нужна конкретная фраза, но она ещё не изучена. Экспериментальная функция Tiny Lesson позволяет описать ситуацию, например, «поиски утерянного паспорта» и получить рекомендации по словарному запасу и грамматике, адаптированные к контексту, например: «Я не знаю, где его потерял» или «Я хочу сообщить об этом в полицию».

Вторая экспериментальная функция получила название Slang Hang, её задача — сделать речь обучающегося менее «учебной», то есть менее формальной, более разговорной и обогащённой местным сленгом. Можно смоделировать реалистичный разговор между носителями языка и по каждой реплике проследить, как разворачивается диалог. Это может быть, например, разговор покупателя с уличным торговцем или сценарий встречи двух давно потерявших друг друга приятелей в метро. В рамках этого экспериментального проекта, признались в Google, ИИ иногда неправильно применяет сленг, поэтому его рекомендации лучше сопоставлять с надёжными источниками.

 Источник изображений: googleblog.com

Третий эксперимент получил название Word Cam: пользователь делает снимок окружающих его предметов, Gemini их распознаёт и предлагает названия на изучаемом языке. Иногда на практике требуется знать, как называются предметы вокруг, и эта функция может продемонстрировать, что пользователь ещё многого не изучил. Например, можно знать слово «окно», но не «жалюзи». Идея этих проектов состоит в том, чтобы обозначить новые варианты использования ИИ, сделать самостоятельное изучение языков более динамичным и личностно ориентированным.

Новые экспериментальные функции Google Gemini способны помочь в изучении следующих языков: арабский, китайский (материковый Китай, Гонконг, Тайвань), английский (Австралия, Великобритания, США), французский (Канада, Франция), немецкий, греческий, иврит, хинди, итальянский, японский, корейский, португальский (Бразилия, Португалия), русский, испанский (Латинская Америка, Испания) и турецкий. Доступ к ним открывается через платформу Google Labs.

Google готовит Gemini для детей — ИИ будет под контролем родителей

Google собирается открыть доступ к помощнику с искусственным интеллектом Gemini для детей до 13 лет, чьи устройства контролируются родителями с помощью приложения Family Link. Компания предупредила, что ИИ может вести себя непредсказуемо.

 Источник изображения: blog.google

Источник изображения: blog.google

Google сообщила о намерении выпустить детский вариант Gemini — для этой аудитории предлагаются такие варианты использования, как помощь с домашними заданиями, ответы на вопросы и генерация сказок с учётом возраста ребёнка. Дети смогут взаимодействовать с ИИ-помощником в приложениях для Android, iOS, а также в веб-версии Gemini; на Android службу можно будет установить в качестве помощника по умолчанию.

Учитывая непредсказуемость современных моделей ИИ, Google предупредила пользователей, что «Gemini может допускать ошибки», и порекомендовала родителям научить детей «относиться к ответам Gemini критически». В компании подчеркнули, что ребёнок должен понимать: Gemini — не человек; он может отвечать, как человек, но не обладает сознанием и эмоциями. Поэтому ребёнку следует проверять получаемую информацию и не доверять ИИ конфиденциальные данные. Родителям также стоит учитывать, что механизмы ограничения контента у ИИ не совершенны, и Gemini потенциально может продемонстрировать нежелательные материалы. В связи с этим контроль над системой будет осуществляться через приложение Family Link. О сроках развёртывания детской версии Gemini Google пообещала сообщить дополнительно.

ИИ-помощник Google Gemini появится в автомобилях, умных часах и наушниках

В последние пару лет Google активно интегрирует чат-бота Gemini с искусственным интеллектом в свои продукты: в Gmail, Android, «Google Диск» и другие сервисы. К концу года присутствие чат-бота расширится — он появится на платформе Wear OS для умных часов, Android Auto для автомобилей и в беспроводных наушниках.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе брифинга после квартального финансового отчёта гендиректор холдинга Alphabet Сундар Пичаи (Sundar Pichai) объявил, что в скором времени Gemini появится на новых устройствах: «Мы обновим Google Assistant на мобильных устройствах до Gemini, а позже в этом году обновим планшеты, автомобили и устройства, которые подключаются к смартфону, такие как наушники и часы». В этом году конференция разработчиков Google I/O запланирована на 20–21 мая — возможно, на ней компания подробнее расскажет о своих планах расширить присутствие Gemini.

Google Gemini уже является помощником по умолчанию на большинстве устройств под управлением Android, но его ещё нет на планшетах, часах с Wear OS, а также умных колонках и дисплеях Google. Планы компании подтвердил анализ бета-версий некоторых приложений. Так, в приложении Google обнаружились фрагменты кода, указывающие, что Gemini появится на Wear OS в качестве «носимого» помощника — вероятно как обновление существующего приложения «Google Ассистент». Сначала компания обновит лишь приложение, а затем усилит интеграцию с выпуском Wear OS 6.

В недавнем выпуске «Google Ассистента» для Android Automotive обнаружились строки, указывающие, что Google усердно работает над переносом Gemini и на автомобильную платформу. Компания разрабатывает модели ИИ, адаптированные для работы в новых областях с большим потенциалом роста, в том числе для робототехники, добавил господин Пичаи.


window-new
Soft
Hard
Тренды 🔥
YouTube может снизить скорость видео для пользователя при обнаружении блокировщиков рекламы 2 ч.
Meta переманила основателя Scale AI и получила 49 % акций стартапа за $14,3 млрд 2 ч.
Новая статья: Pipistrello and the Cursed Yoyo — замечательное приключение с ноткой ностальгии. Рецензия 7 ч.
Epic Games продолжает борьбу против читеров в Fortnite — студия подала в суд на разработчика и продавцов программ Sincey Cheats и Vanta Cheats 8 ч.
Чемоданный ИИ: в Китае придумали, как обучать модели на чипах Nvidia, которые нельзя ввезти в страну 8 ч.
«Хотим создать нечто действительно особенное»: Heroes of Might & Magic: Olden Era не выйдет в раннем доступе летом 9 ч.
Techland пообещала не бросать Dying Light 2 Stay Human из-за Dying Light: The Beast — у студии ещё «много очень и очень крутых идей» для игры 10 ч.
Несмотря на громкие провалы, Sony всё ещё нацелена на создание «разнообразных и устойчивых» игр-сервисов 12 ч.
Гейминг на Mac вышел на новый уровень: Steam наконец получил нативную поддержку процессоров Apple 12 ч.
Агрессивный план отменяется: Sony продолжит «очень вдумчиво» переносить эксклюзивы PlayStation на ПК 13 ч.
Samsung договорилась о поставках HBM3E для ускорителей AMD Instinct MI350 27 мин.
Micron вложит $200 млрд в производство чипов в США и создаст 90 тысяч рабочих мест 2 ч.
Oracle пообещала построить больше облачных ЦОД, чем все конкуренты вместе взятые 6 ч.
Робопсы Boston Dynamics станцевали в шоу «Америка ищет таланты» — один из них не справился с страхом сцены 6 ч.
Nvidia вычеркнула Китай: Хуанг больше не будет включать Поднебесную в планы по прибыли 7 ч.
И нашим, и вашим: Talen всё-таки поставит 1,92 ГВт энергии с АЭС дата-центрам AWS, но опосредованно 7 ч.
Закат эпохи DDR4: Micron объявила о прекращении выпуска устаревшей памяти 8 ч.
Новозеландцы продали США первый космоплан для суборбитальных полётов 9 ч.
Раскол Intel — вопрос времени: аналитики не верят, что компания справится с кризисом без разделения 10 ч.
Сделка Synopsys и Ansys на $35 млрд под угрозой — Китай отложил её одобрение 12 ч.