Сегодня 01 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gemini
Быстрый переход

Google научила Gemini создавать комиксы и иллюстрированные книги рассказов на русском и других языках

Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей. Искусственному интеллекту можно поручить создание любой истории на основе текстового запроса. В качестве «вдохновения» для рассказов ИИ способен использовать фотографии, изображения и файлы пользователя.

 Источник изображений: Google

Источник изображений: Google

Gemini, например, можно попросить придумать рассказ, который объяснит ребёнку строение Солнечной системы или расскажет о важности доброго отношения к младшим братьям и сёстрам. Также ИИ можно поручить написать целый сборник на основе детских рисунков.

Для готовой работы доступен предварительный просмотр. По словам Google, генерация сборника занимает всего несколько минут. Затем Gemini загружает интерфейс в стиле Canvas с двумя колонками: в правой части экрана отображается книга, а в левой — чат. При желании можно задать стили оформления: пиксельная графика, комиксы, пластилиновая анимация, орнамент, раскраска и другие.

В итоге получается десятистраничная книга с иллюстрациями и аудиосопровождением. Gemini позволяет прослушивать её в разных тональностях — с более высоким или низким голосом. Также доступна возможность поделиться ссылкой на книгу или скачать её для последующей печати.

Новая функция Gemini по созданию рассказов поддерживает 45 языков, в том числе русский, и доступна по всему миру — как в мобильном приложении Gemini, так и в его версии для ПК.

Google выпустила Gemini 2.5 Deep Think — рассуждающую ИИ-модель, которая параллельно обдумывает несколько идей

Подразделение Google DeepMind объявило о запуске Gemini 2.5 Deep Think — самую продвинутую модель искусственного интеллекта компании, по словам самих разработчиков. Она способна отвечать на пользовательские запросы, исследуя и рассматривая несколько вариантов одновременно, а затем сравнивая полученные результаты и выбирая лучший из них. Обладатели подписки Google Ultra стоимостью $250 в месяц получат доступ к ИИ-модели уже на этой неделе.

 Источник изображений: Google

Источник изображений: Google

Google анонсировала Gemini 2.5 Deep Think на ежегодной конференции Google I/O в мае этого года, заявив, что это первая общедоступная модель компании, содержащая в себе множество ИИ-агентов. Такой подход позволяет нейросети задействовать разных ИИ-агентов для параллельной обработки запроса и поиска разных вариантов ответа на него. Это также требует значительно больше вычислительных ресурсов, но и конечный результат, как правило, значительно лучше, чем при использовании системы с одним ИИ-агентом.

В прошлом месяце сообщалось, что алгоритм Gemini 2.5 Deep Think сумел добиться результатов на уровне золотой медали на Международной математической олимпиаде (IMO). Вместе с Gemini 2.5 Deep Think разработчики откроют доступ к версии ИИ-модели, которая участвовала в математической олимпиаде, но только для группы избранных математиков и учёных. Google рассчитывает, что этот алгоритм повысит эффективность исследований, поэтому компания стремится получить отзывы о том, как можно улучшить мультиагентную систему для использования в академических целях.

Google отметила, что ИИ-модель Gemini 2.5 Deep Think была значительно улучшена по сравнению с версией, которую анонсировали на конференции I/O в мае. Этому способствовала разработка «новых методов обучения с подкреплением», что стимулирует алгоритм к более эффективному использованию своих логических возможностей.

По данным Google, новая ИИ-модель хорошо справилась с тестом «Последний экзамен человечества», который содержит тысячи однозначных и проверяемых академических вопросов по математике, гуманитарным и естественным наукам. По данным Google, нейросеть компании набрала в этом тесте 34,8 % баллов, тогда как алгоритм Grok 4 от xAI набрал только 25,4 %, а OpenAI o3 — 20,3 %. Google также утверждает, что Gemini 2.5 Deep Think превосходит аналоги от OpenAI, xAI и Anthropic в бенчмарке LiveCodeBench6, где собраны сложные задачи по программированию. В серии тестов ИИ-модель Google набрала здесь 87,6 %, в то время как результат Grok 4 составил 79 %, а o3 — 72 %.

Gemini 2.5 Deep Think автоматически задействует нужные ИИ-агенты, например, для написания программного кода или поиска в интернете. По словам разработчиков, нейросеть способна выдавать «гораздо более длинные ответы» по сравнению с традиционными ИИ-моделями. В ближайшее время Google планирует открыть доступ к Gemini 2.5 Deep Think для избранной группы разработчиков через соответствующий API.

Квадриллион токенов за месяц: Google рассказала о нагрузке на свои ИИ-сервисы в июне

Google сообщила, что её ИИ-сервисы обработали почти квадриллион токенов в июне. Под токенами принято понимать единицы данных, обрабатываемые моделями ИИ во время обучения и генерации, что даёт представление о масштабах использования соответствующих сервисов Google. Токены могут включать текст, изображения, аудиоклипы, видео или другие модальности.

 Источник изображения: Google

Источник изображения: Google

По данным компании OpenAI — конкурента Google в области генеративных ИИ-технологий — один токен обычно эквивалентен четырём символам английского текста, а один абзац содержит в среднем около 100 токенов. Например, текст Декларации независимости США состоит из 1695 токенов.

«В прошлом месяце мы обработали почти 1 000 000 000 000 000 токенов, что более чем вдвое больше, чем в мае», — заявил генеральный директор Google DeepMind Демис Хассабис (Demis Hassabis) в социальной сети X.

Увеличение числа обработанных токенов не обязательно означает рост количества пользователей ИИ-сервисов, однако определённо указывает на то, что рассуждающие ИИ-модели обрабатывают значительно больше данных за одно использование. Google начала развёртывание семейства моделей логического вывода Gemini 2.5 в конце марта.

Рост объёма обрабатываемых токенов требует расширения инфраструктуры центров обработки данных. В этом месяце Google сообщила, что ожидает увеличения капитальных затрат на ЦОДы на $10 млрд — до $85 млрд в год.

«В вычислительных технологиях важен объём ресурсов, необходимых для обучения. Часто эти ресурсы нужно размещать в одном месте, поскольку ограничения пропускной способности между дата-центрами могут повлиять на эффективность. Сейчас ИИ-системы интегрируются в продукты, которыми пользуются миллиарды людей по всему миру, и требуют огромных вычислительных мощностей для генерации ответов. Кроме того, новый тренд в ИИ — рассуждающие модели — становится всё более актуальным: такие модели становятся умнее в зависимости от того, сколько времени им даётся на логическое размышление. Всё это требует всё больших ресурсов, и я не вижу признаков замедления в этом направлении. По мере совершенствования ИИ-системы будут становиться более полезными и востребованными», — рассказал в Хассабис ранее в подкасте Лекса Фридмана (Lex Fridman).

Аудитория ИИ-поиска в Google выросла до 100 миллионов человек в месяц

В ходе брифинга по итогам финансового отчёта Alphabet за II квартал глава холдинга Сундар Пичаи (Sundar Pichai) рассказал о работе над режимом искусственного интеллекта в поиске, о новой флагманской модели Gemini 2.5 Pro и функции Deep Search, которые Google сейчас активно развёртывает.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

У поискового ИИ-режима «уже более 100 млн активных пользователей в месяц в США и Индии»; тестирование «ИИ-поиска полного цикла» стартовало в марте, полноценный запуск функции в США состоялся в конце мая, в Индии — в начале июля. На минувшей неделе Google начала развёртывать общедоступную версию Gemini 2.5 Pro — подписчики Google AI Pro и AI Ultra теперь могут переключаться на неё. В десктопной и мобильной веб-версиях появилась функция «глубокого исследования» (Deep Search); но она пока отсутствует в приложениях для Android и iOS, а переключать модели в ИИ-поиске можно только после получения выдачи по первому запросу.

В ответ на многочисленные вопросы о том, почему у Google есть и поисковое приложение с ИИ-режимом, и отдельное приложение чат-бота Gemini, Сундар Пичаи ответил, что «есть несколько вариантов использования, при которых можно получить отличный результат в обоих приложениях, но есть и специфические». Поисковый ИИ-режим больше подходит для «информационно-ориентированных» запросов, тогда как в Gemini поиск является лишь одним из инструментов — чат-бот представляет собой скорее помощника в выполнении конкретных задач, включая генерацию видео и программного кода.

«Я рад, что у нас есть две плоскости, и мы можем внедрять инновации в обеих этих областях. И конечно, будут области, в которых приложения заработают совместно, а со временем, думаю, мы сможем сделать их работу удобнее для наших пользователей», — заключил господин Пичаи.

ИИ-модель Google Gemini получила золотую медаль Международной математической олимпиады

На прошедшей в мае конференции I/O 2025 компания Google анонсировала режим глубокого мышления (Deep Think) для своей передовой нейросети Gemini. И хотя он ещё недоступен широкому кругу пользователей, ИИ-модель с его помощью сумела добиться результата на уровне золотой медали в Международной математической олимпиаде (IMO).

 Источник изображения: Google

Источник изображения: Google

Международная математическая олимпиада является одним из наиболее престижных соревнований для молодых математиков, которое проводится ежегодно с 1959 года. Каждая страна, принимающая участие в этом мероприятии, представлена шестью сильнейшими математиками школьного возраста. Им предстоит соревноваться в решении шести исключительно сложных задач по алгебре, комбинаторике, геометрии и теории чисел. Золотые медали получают лучшие участники (примерно 8 % от общего количества соревнующихся).

На прошлой неделе состоялась IMO 2025. Теперь же Google объявила, что «продвинутая версия Gemini Deep Think решила пять из шести задач IMO, набрав в общей сложности 35 баллов и добившись результата на уровне золотой медали». Вместе с этим Google опубликовала ход решений, которые использовал ИИ-алгоритм на олимпиаде. «Чтобы максимально использовать логические возможности Deep Think, мы дополнительно обучили эту версию Gemini с помощью новых методов обучения с подкреплением, которые позволяют задействовать больше данных для многоэтапных рассуждений, решения проблем и доказательства теорем. Мы также предоставили Gemini доступ к тщательно отобранному набору решений математических задач и добавили в инструкции несколько общих указаний на то, как следует решать задачи IMO», — говорится в сообщении Google.

Олимпиада IMO является хорошей возможностью для проверки способностей ИИ-алгоритма в решении математических задач и ведении рассуждений. В прошлом году алгоритм Google добился результата на уровне серебряной медали, решив четыре из шести задач и набрав в сумме 28 баллов. В этом году ИИ-модель «работала от начала до конца на естественном языке, приводя строгие математические доказательства непосредственно из описаний задач — и всё это в рамках 4,5-часового регламента соревнований». Новый алгоритм способен одновременно исследовать и комбинировать несколько возможных вариантов решения задачи, прежде чем дать окончательный ответ. Ранее нейросеть могла лишь следовать одной выбранной цепочке рассуждений.

ИИ Google Gemini отказался играть в шахматы с древней приставкой Atari 2600, испугавшись поражения

Чат-бот Google Gemini отказался от партии в шахматы с консолью Atari 2600, когда узнал, что ей удалось обойти другие модели искусственного интеллекта — OpenAI ChatGPT и Microsoft Copilot.

 Источник изображения: GR Stocks / unsplash.com

Источник изображения: GR Stocks / unsplash.com

Инженер Роберт Карузо (Robert Caruso), организовавший шахматные партии между Atari Chess и передовыми системами ИИ OpenAI ChatGPT и Microsoft Copilot, решил проверить способности Google Gemini. Это было логичным шагом, поскольку ChatGPT и Copilot в некоторой степени являются родственными — обе системы построены на платформе OpenAI, тогда как Gemini — принципиально иная мультимодальная большая языковая модель, разработанная Google.

Обсуждая предстоящую партию, Gemini заявил, что почти наверняка победит Atari Chess, отметив, что «та даже близко не является большой языковой моделью». Чат-бот от Google утверждал, что «больше похож на современный шахматный движок, <…> который умеет просчитывать миллионы ходов вперёд и оценивать бесконечное количество позиций». В ответ на это инженер указал, что ChatGPT и Copilot тоже поначалу хвастались своими способностями и предсказывали лёгкую победу, но в итоге проиграли изрядно устаревшей системе.

Это резко изменило поведение Google Gemini — чат-бот признал, что преувеличил своё шахматное мастерство, и в действительности ему «будет очень трудно противостоять игровому движку Atari 2600 Video Chess». В итоге ИИ заявил, что «с точки зрения времени самым эффективным и разумным решением, вероятно, будет отмена матча». Так, запущенный инженером симулятор Atari 2600 с процессором на 1,19 МГц и всего 128 Кбайт оперативной памяти отпугнул Google Gemini, который не сделал ни единого хода. С другой стороны, чат-бот впечатлил своей способностью заранее оценивать собственные возможности.

«Добавить такие проверки в реальных условиях — это не просто способ избежать забавных ошибок в шахматах. Речь о том, чтобы ИИ стал более надёжным, заслуживающим доверия и безопасным — особенно в критических обстоятельствах, где у ошибок могут быть серьёзные последствия. Чтобы ИИ оставался крепким инструментом, а не бесконтрольным оракулом», — прокомментировал исследователь результаты эксперимента.

ИИ-сводки в Gmail превратили в инструмент для фишинговых атак, но Google уже закрыла уязвимость

Специалисты по кибербезопасности, участвуя в программе Bug Bounty от Mozilla, обнаружили уязвимость в функции автоматического создания сводок переписок в Gmail с помощью искусственного интеллекта Gemini — она может быть использована для фишинговых атак. Злоумышленники способны внедрять в письма скрытые инструкции, заставляя ИИ формировать ложные предупреждения и вводить пользователей в заблуждение, сообщил PCMag.

 Источник изображения: Solen Feyissa/Unsplash

Источник изображения: Solen Feyissa/Unsplash

В рамках эксперимента исследователи показали, как с помощью невидимого текста — оформленного белым цветом и с нулевым размером шрифта — можно внедрить команды в тело письма. При этом пользователь не видит дополнительного содержимого, но ИИ считывает его и использует при формировании краткой сводки. В результате Gemini может добавить в неё ложное уведомление о взломе аккаунта и предложить позвонить на мошеннический номер якобы для восстановления доступа.

 Источник изображения: pcmag.com

Источник изображений: pcmag.com

Google подтвердила наличие проблемы, отметив, что уже внесла изменения, устраняющие уязвимость. Представители компании сообщили PCMag, что регулярно совершенствуют защиту своих моделей, включая их обучение противодействию вредоносным атакам, и заверили, что описанный метод не применялся хакерами в реальных атаках.

Ранее Google также публиковала материалы о борьбе с «инъекциями промптов» — способами злонамеренного воздействия на ИИ через скрытые пользовательские команды.

Google Gemini научился превращать фото в восьмисекундные видео со звуком, но небесплатно

Google обучила свой ИИ-чат-бот Gemini анимировать статичные фотографии, преобразовывая их в видеоклипы длительностью 8 секунд. Функция основана на видеомодели Veo 3 и также может дополнить клип звуковым сопровождением в виде фоновых шумов, звуков окружающей среды и речи.

 Источник изображения: Google

Источник изображения: Google

Чтобы превратить фотографии в видео, достаточно выбрать «Видео» в меню инструментов чат-бота и загрузить фотографию. Затем можно добавить текстовое описание того, что вы хотите увидеть и услышать. Как итог — ролик в формате MP4 с разрешением 720p и соотношением сторон 16:9.

Во всех роликах будет видимый водяной знак, подтверждающий, что видео создано ИИ, а также невидимый цифровой водяной знак SynthID. Функция уже доступна платным подписчикам Google AI Ultra и Pro «в отдельных странах». В течение недели она появится и на мобильных устройствах.

ИИ-помощник Google Gemini появился на Pixel Watch и других смарт-часах с Wear OS

На конференции Google I/O в мае компания пообещала в скором будущем выпустить приложение помощника с искусственным интеллектом Gemini для умных часов под управлением Wear OS. Накануне сервис действительно дебютировал на устройствах этого типа — первыми его получили модели серии Samsung Galaxy Watch8.

 Источник изображения: Google

Источник изображения: Google

Из-за компактного размера и отсутствия камер умные часы не смогут работать с полноценным вариантом Gemini (с функцией Gemini Live), доступным на смартфонах и ПК, но самые важные голосовые функции поддерживаются. Можно задавать Gemini практически любые вопросы, и он будет давать ответы либо из собственной базы знаний, либо по результатам веб-поиска. Это пригодится, когда ответ требуется получить быстро, например, если во время готовки руки заняты, необходимо подкорректировать рецепт, а доставать телефон неудобно.

Gemini может работать с приложениями Google и сторонних разработчиков — поддерживается создание заметок, постановка задач, создание напоминаний и событий в календаре и многое другое прямо на умных часах. Можно попросить помощника отправить сообщение другу с извинениями за опоздание; получить краткий пересказ поступившего письма; найти адрес для визита к специалисту и сделать многое другое. Gemini начнёт развёртываться на смарт-часах под управлением Wear OS 4 и выше, включая модели от Samsung, Pixel, OnePlus, Oppo и Xiaomi. Последняя версия Wear OS 6 не требуется, но она позволяет ИИ-помощнику интегрироваться с приложениями от производителей часов: данная версия основана на Android 16, в котором появился API App Functions, позволяющий ИИ-помощникам использовать сторонние приложения.

Пока под управлением Wear OS 6 работают только умные часы серии Samsung Galaxy Watch8; платформа также будет работать на других новых устройствах. Прочие модели получат Wear OS 6 с обновлениями ПО, в которых Gemini, вероятно, придёт на смену привычному «Google Ассистенту».

ИИ-функция Circle to Search получила AI Mode и теперь может помочь в прохождении игр

Google расширила функциональность ИИ-инструментов Circle to Search («Обвести и найти») и Gemini Live для Android. Обновление было анонсировано сегодня, одновременно с запуском складных устройств Samsung Galaxy нового поколения. Оно включает новые возможности Gemini Live для устройств Samsung и интеграцию чат-бота Google AI Mode, ориентированного на поиск, непосредственно в Circle to Search.

 Источник изображений: Google

Источник изображений: Google

Режим AI Mode дебютировал в Google Поиске в начале этого года, позволяя пользователям находить информацию и веб-ссылки с помощью чат-бота в стиле Gemini вместо традиционного интерфейса поисковой системы. Пока он недоступен для широкого круга пользователей — за пределами США его запустили только в Индии, — однако теперь, по заявлению Google, получить доступ к AI Mode можно с помощью инструмента Circle to Search на смартфонах Pixel и Samsung. Это позволяет находить информацию прямо на экране, не переключаясь между приложениями.

«Просто нажмите и удерживайте кнопку “Домой” или панель навигации, затем обведите, коснитесь или сделайте жест на том, что хотите найти. Если ответ ИИ покажется вам наиболее полезным, в результатах появится AI Overview. Отсюда прокрутите вниз и нажмите “Подробнее с режимом ИИ”, чтобы задать уточняющие вопросы и узнать больше о визуальном поиске», — говорится в сообщении Google в её блоге.

Circle to Search теперь также может предоставлять внутриигровую помощь мобильным геймерам. Эту функцию Google тестировала ещё в январе. Её можно использовать для поиска информации о персонажах и стратегиях, не выходя из игры, а также для просмотра статей и видео, связанных с конкретным игровым моментом, в котором требуется помощь. Google также заявила, что работает над внедрением режима поиска AI Mode в Google Lens через приложение Google для Android- и iOS-устройств.

Новые Galaxy Z Fold7, Galaxy Z Flip7 и Watch 8, представленные сегодня на мероприятии Samsung Unpacked, стали первыми устройствами с предустановленными Android 16 и Wear OS 6. Google также анонсировала обновление Gemini Live для смартфона Flip 7, которое добавляет возможность передачи изображения с камеры устройства на внешний экран. Это позволяет ИИ-помощнику отвечать на вопросы о том, что он «видит», без необходимости открывать телефон.

Интеграция Gemini Live теперь поддерживается в таких приложениях Samsung, как «Календарь», «Заметки» и «Напоминания». По словам Google, вскоре поддержка Gemini Live появится и в приложениях других производителей. Кроме того, Gemini будет поддерживаться на смарт-часах под управлением Wear OS 6, устройствах Pixel, OnePlus, Oppo, Xiaomi, а также на новых моделях Samsung — Watch 8, Watch 8 Classic и Watch Ultra (2025).

Google открыла Gemini доступ ко всем приложениям на Android и толком не объяснила, как от этого отказаться

Google накануне, 7 июля, развернула изменения, благодаря которым помощник с искусственным интеллектом Gemini получил возможность взаимодействовать со сторонними приложениями, в том числе WhatsApp, даже если пользователи ранее запретили такие взаимодействия. Отказаться от этой функции очень непросто, и в Google простых инструкций не предоставили.

 Источник изображений: blog.google

Источник изображений: blog.google

О нововведении Google сообщила пользователям в электронном письме, где сослалась на страницу поддержки — на ней говорится, что данные, к которым имеет доступ Gemini, «читают, комментируют и обрабатывают люди-рецензенты (включая поставщиков услуг)». В письме отсутствуют полезные рекомендации по действиям, которые следует предпринять, чтобы отказаться от указанных изменений; зато говорится, что пользователи могут блокировать приложения для взаимодействия с Gemini, но даже в этом случае собранные данные хранятся 72 часа.

В письме не объясняется, можно ли полностью удалить Gemini с устройств под управлением Android; и, видимо, оно противоречит само себе относительно того, как это сделать, и возможно ли это вообще. В одном месте говорится, что изменения развёртываются в автоматическом режиме со вчерашнего дня, открывая Gemini доступ к таким приложениям как WhatsApp, «Google Сообщения» и «Google Телефон». Ниже по тексту указывается: «Если вы уже отключили эти функции, они останутся отключёнными». О возможности полностью удалить механизмы интеграции Gemini не сообщается нигде.

Пользователи одного из серверов соцсети Mastodon и журналисты Ars Technica заинтересовались вопросом, но в справочном разделе Google им удалось только найти инструкцию по настройке Gemini в учётной записи — минимум в одном из случаев само приложение на устройстве в явном виде отсутствовало. В стремлении прояснить ситуацию они обратились за помощью к Google, но в компании ответа на вопрос не дали, и, в частности, заявили: «Это обновление полезно для пользователей: теперь они могут пользоваться Gemini для выполнения повседневных задач на мобильных устройствах, в том числе для отправки сообщений, совершения телефонных звонков и установки таймеров при отключённой [настройке] Gemini Apps Activity. Когда Gemini Apps Activity отключена, их переписка не читается и не используется для улучшения наших моделей ИИ». Представитель компании также продублировал ссылку на одну из обнаруженных ранее страниц, содержимое которой не прояснило ситуацию.

Дополнительно прояснить ситуацию попытались эксперты компании Tuta — поставщика конфиденциальных сервисов электронной почты и календаря. Они сделали вывод, что своей интеграцией Gemini в Android компания Google решила пойти по стопам Microsoft с её Internet Explorer в Windows — тогда всё закончилось затяжным судебным разбирательством. По версии Tuta, отключение Gemini Apps Activity предотвратит дальнейший сбор данных, а собранная ранее информация будет удалена за 72 часа; на устройства без установленного приложения Gemini оно самопроизвольно устанавливаться не станет. Один из способов защитить свою конфиденциальность — полное удаление Gemini с устройства, но для этого может понадобиться запуск отладки Android и работа с интерфейсом командной строки.

В Gmail, «Диске» и других сервисах Google появились ИИ-боты Gem, настраиваемые под конкретные задачи

Google открыла пользователям приложений Workspace доступ к Gem — настраиваемым версиям помощника с искусственным интеллектом Gemini, которые специализируются на определённых задачах, и приложение Gemini для этого открывать не требуется.

 Источник изображения: workspaceupdates.googleblog.com

Источник изображения: workspaceupdates.googleblog.com

Чат-боты Gem открываются на боковой панели в службах «Документы», «Таблицы», «Презентации», «Диск» и Gmail — для работы с определённым чат-ботом не потребуется переключаться между приложениями. Управляя чат-ботом, можно сделать его «экспертом» в определённых задачах, с которыми пользователь работает регулярно — это может быть написание текстов для одного бренда или подготовка к экзаменам. Google также предлагает настроенные версии Gem для редактирования текста, написания кода, генерации идей для продаж и для других целей. Вот какие варианты предлагает сама компания:

  • Gem-копирайтер для написания публикаций и прочих материалов, адаптированных для указанной целевой аудитории;
  • Gem, который поможет с продажами, исходя из информации о конкретной компании, потенциальном клиенте или отрасли;
  • адаптированный для должности пользователя «помощник Gem», предоставляющий релевантные сводки и материалы для внутренних публикаций;
  • Gem, разработанный для взаимодействия с определённым лицом — топ-менеджером или гендиректором, — генерирующий убедительные сообщения.

Ранее настраиваемыми чат-ботами Gem можно было пользоваться только в приложении Gemini. Сейчас создавать новые варианты можно прямо из боковой панели Workspace. Новые возможности начали развёртываться для всех пользователей платформы с доступом к Gemini со вчерашнего дня, но в отдельных случаях придётся подождать «более 15 дней».

Google доработала и перезапустила ИИ-функцию Ask Photos для поиска фото по содержимому

После небольшой паузы Google вернулась к развёртыванию функции Ask Photos на базе искусственного интеллекта, которая позволяет осуществлять поиск по содержимому снимков. Разработчики не только расширили доступность этого ИИ-инструмента, но и внесли ряд улучшений в его работу.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Функция Ask Photos задействует ИИ-помощника Gemini, чтобы пользователь мог находить фотографии на основе их содержимого. Ранее в этом месяце Google приостановила развёртывание функции, а представитель компании заявил, что Ask Photos «не соответствует требованиям с точки зрения скорости обработки запросов, качества и удобства использования».

Позднее Google сообщила, что компания услышала отзывы пользователей, в том числе касательно того, что ИИ-функция поиска по содержимому фото должна работать быстрее, отвечая на простые запросы, такие как «пляж» или «животные». Теперь функция моментально выдаёт результаты поиска на простые запросы, тогда как Gemini продолжает работать в фоновом режиме, чтобы находить больше соответствующих запросу снимков. В дополнение к этому Google сообщила, что Ask Photos выходит за рамки раннего доступа и становится доступна большему количеству пользователей в США.

Google Assistant скоро уступит место на Android-устройствах нейросети Gemini

На Android скоро появится возможность использовать нейросеть Gemini для управления устройством без нарушения конфиденциальности. Как стало известно из уведомления Google, отправленного пользователям и изученного изданием Android Police, с 7 июля ИИ-ассистент сможет управлять телефонными звонками, сообщениями, WhatsApp и другими системными функциями. Пользователи смогут давать команды боту, не опасаясь, что их диалоги будут использоваться для обучения ИИ при активированной опции Gemini Apps.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Ранее отключение опции Gemini Apps не только запрещало Google использовать диалоги с Gemini, но и ограничивало функциональность самого ассистента. Теперь же пользователи смогут поручить боту, например, установить будильник, позвонить контакту или отправить сообщение в мессенджере, не разрешая при этом запоминать и анализировать свои запросы, пишет The Verge.

Первоначальная формулировка уведомления Google вызвала вопросы, так как некоторые пользователи заподозрили, что обновление может предоставить нейросети доступ ко всей информации на устройстве. Однако представители компании пояснили, что разрешения на работу с приложениями полностью остаются под контролем владельца устройства, а обновление направлено на улучшение пользовательского опыта.

Отмечается, что этот шаг стал частью плана по замене Google Assistant на устройствах Android на более продвинутую ИИ-модель Gemini, которая сможет выполнять те же функции, что и прежний голосовой помощник, но с гибкими настройками приватности. При этом компания оставляет за собой право хранить данные о взаимодействии с нейросетью до 72 часов с целью обеспечения безопасности.

Google AI Pro стал доступен по годовой подписке — экономия составит 16%

Компания Google расширила варианты подписки на премиум-тариф Google AI Pro, который предоставляет расширенный доступ к функциям и моделям искусственного интеллекта, включая Gemini. Теперь, помимо ежемесячной подписки за $19,99, также появится годовая подписка стоимостью $199,99, позволив сэкономить $40 в год.

 Источник изображения: Google

Источник изображения: Google

Как поясняет 9to5Google, ранее сервис, изначально называвшийся Google One AI Premium, предлагал только ежемесячные платежи, хотя годовая подписка уже была доступна для тарифа с 5 Тбайт за $249,99. Обладатели годовой подписки получают 2 Тбайт в Google Drive, Gmail и Photos, расширенные возможности Gemini, включая повышенные лимиты для версии 2.5 Pro.

Также доступно лимитированное использование генератора видео Veo 3, который может создавать видеоролики на основе текстовых описаний, включая звуковое сопровождение, в разрешении до 4K с продолжительностью видео до нескольких минут. После исчерпания квот можно использовать генератор Veo 2, также предназначенный для генерации видео по текстовому запросу, но с меньшей функциональностью.

Доступен и инструмент для создания фильмов Flow с частичным доступом к Veo 3. Напомним, Flow — это первый общедоступный продукт Google, который объединяет три ключевые ИИ-системы компании. Открывая новые возможности для видеопроизводства, Flow формирует уникальную визуальную эстетику, где операторская работа и аудио создаются нейросетями с минимальным участием человека.

В рамках подписки предоставляется 1000 ежемесячных ИИ-кредитов на создание видео, расширенные возможности использования NotebookLM, интеграция Gemini в Gmail, Docs, Vids и другие сервисы, увеличенная продолжительность встреч в Google Meet, возможность планирования встреч через Google Calendar и возврат 10 % от покупок в Google Store.

 Источник изображения: 9to5google.com

Источник изображения: 9to5google.com


window-new
Soft
Hard
Тренды 🔥
Meta может начать использовать ИИ-модели Google и OpenAI в своих приложениях 21 ч.
Белый дом приказал вернуть ИИ-бота xAI Grok «как можно скорее» 23 ч.
Новая статья: Is This Seat Taken? — все когда-нибудь сядут. Рецензия 31-08 00:02
Meta без спроса заполонила свои соцсети ИИ-двойниками Тейлор Свифт, Скарлетт Йоханссон и других знаменитостей 30-08 17:59
Nous Research бросил вызов OpenAI — открытая модель Hermes 4 работает быстрее всех и без цензуры 30-08 16:36
Стартап Илона Маска обвинил бывшего сотрудника в краже секретов для OpenAI 30-08 14:19
xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно 30-08 14:04
Тестирование крупного обновления Windows 11 25H2 вышло на финишный этап 30-08 11:45
ЕС всё же оштрафует Google за антиконкурентное поведение, но наказание будет скромным 30-08 10:43
Meta исправила методику обучения ИИ после скандала с неуместными разговорами с подростками 30-08 10:23