Сегодня 11 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gemini
Быстрый переход

Google добавила в Gmail, «Документы» и Vids новые ИИ-функции

На конференции Google I/O 2025 компания представила множество новых функций на основе искусственного интеллекта для приложений из рабочего комплекта Workspace — изменения коснулись сервисов Gmail, «Google Документы» и видеоредактора Google Vids.

 Источник изображений: Google

Источник изображений: Google

Функция персонализированных интеллектуальных ответов Gmail помогает в составлении писем с учётом контекста и тона — система анализирует предыдущую переписку, файлы в облачном хранилище «Google Диск» и готовит ответы с актуальными данными. Манера письма подстраивается под тон пользователя — формальный или разговорный. С функцией очистки входящих сообщений ИИ-помощник Gemini принимает решения об удалении или перемещении в архив писем, которые больше не нужны — достаточно, например, в свободной форме дать ему команду удалить все непрочитанные письма от определённого адресата за минувший год.

Ещё одна новая возможность Gmail помогает оперативно планировать встречи и совещания с адресатами вне организации пользователя. Он назначает время встречи или совещания при участии Gemini — это, по словам Google, сокращает время и усилия, которые традиционно тратятся на сверку расписаний. Все эти новые функции почтовой службы станут общедоступными в ближайшие месяцы.

 Источник изображений: Google

В «Google Документах» появилась возможность устанавливать прямую связь приложения с данными презентаций, таблиц и отчётов — помогая в написании документов, Gemini берёт в качестве исходной информации только эти источники, то есть генерируемый системой текст основывается только на надёжном материале. Функция уже вышла в общий доступ.

Редактор Google Vids получил возможность превращать существующие документы «Google Презентаций» в видео. Gemini предлагает помощь в составлении сценариев, может сгенерировать закадровый голос, анимации и многое другое — функция станет общедоступной в ближайшие месяцы. В Google Vids появились ИИ-аватары, которые пригодятся компаниям, не располагающими средствами для съёмки видео или привлечения диктора. Можно подготовить сценарий и выбрать аватар, который зачитает сообщение в специально подготовленном видео — это пригодится для корпоративных объявлений, создании справки по продуктам и в других целях. ИИ-аватары выйдут в общий доступ в июне.

Ещё одна новая функция Google Vids — «Обрезка стенограммы» (Transcript trim), предполагающая автоматическое удаление из выступлений слов-паразитов и лишних междометий. Для регулирования уровня звука пригодится функция «Сбалансировать звук» (Balance sound) — она выйдет в общий доступ в июне; «Обрезка стенограммы» появится в экспериментальном разделе Labs в ближайшие месяцы. Наконец, более качественные иллюстрации в документах теперь помогает создавать новая версия генератора изображений Imagen 4, доступ к которой открылся в рабочих приложениях.

Google анонсировала запуск AI Mode — ИИ-поиск будущего с анализом данных, графиками и 3D-примеркой

Google объявила о масштабном запуске расширенного поиска с ИИ AI Mode, который позволяет задавать сложные, многоуровневые вопросы и получать развёрнутые ответы с анализом данных. Функция начнёт появляться у пользователей в США, а затем станет доступна во всём мире.

 Источник изображения: Google

Источник изображений: Google

AI Mode строится на основе существующего инструмента AI Overviews, который показывает краткие ИИ-сводки в начале поисковой выдачи. Несмотря на отдельные казусы прошлого, например, совет использовать клей вместо соуса для пиццы, этот формат быстро набрал популярность. По статистике им ежемесячно пользуются более 1,5 миллиарда человек. Как отмечает TechCrunch, теперь AI Overviews выйдет из тестового режима, расширится на 200 стран и получит поддержку более 40 языков.

Новый AI Mode предназначен для сложных запросов, включая сравнение товаров и анализ данных. Он использует технологию Deep Search, которая разбивает вопрос на подтемы и обрабатывает десятки, а то и сотни запросов, чтобы сформировать детальный отчёт со ссылками на источники. Google утверждает, что это реально экономит часы ручного поиска.

Также анонсирован автоматический помощник для покупок, который сможет отслеживать цену на товар и, в случае снижения, уведомить о возможности покупки. Ещё появится функция виртуальной примерки одежды. Пользователи смогут загружать свои фото, а ИИ будет «надевать» на них выбранные вещи в 3D-формате, учитывая комплекцию человека и тип ткани одежды. Функция начнёт тестироваться в Search Labs с сегодняшнего дня.

Для обработки информации в AI Mode и AI Overviews используется специальная версия модели Gemini 2.5. В будущем часть функций AI Mode постепенно перейдёт и в AI Overviews. Пользователи смогут задавать вопросы, например, из сферы спорта и финансов, и получать в ответ не просто цифры, а визуализированные графики и таблицы.

Ещё одно нововведение касается интеграции ИИ-агента Project Mariner, который может самостоятельно бронировать билеты, столики в ресторанах и находить в интернете различные мероприятия. А позднее выйдет Search Live — «Живой поиск» — с помощью которого пользователи смогут задавать вопросы посредством камеры смартфона, а ИИ будет отвечать в реальном режиме времени подобно системе мультимодального ИИ-помощника Project Astra.

Также будет усилена персонализация. Если подключить Gmail (или другой сервис Google), поисковик будет учитывать предпочтения пользователя и предлагать результаты на основе писем электронной почты. При этом пользователь сам решает, какие приложения подключать, а какие — нет.

Google мощно обновила приложение Gemini: изучение мира в реальном времени, улучшенный Deep Research и многое другое

Google рассказала на конференции Google I/O 2025 о новых возможностях чат-бота Gemini с искусственным интеллектом: расширились мультимодальные функции платформы, открылся доступ к новым моделям ИИ, готовится глубокая интеграция с сервисами Google.

 Источник изображений: blog.google

Источник изображений: blog.google

В очередном обновлении приложения расширились функции Gemini Live для всех её пользователей под Google Android и Apple iOS. Теперь можно беседовать с Gemini в режиме, близком к реальному времени, одновременно транслируя ИИ видео с камеры или экрана смартфона. Во время прогулки по незнакомому городу можно направить камеру телефона на одно из зданий и спросить у Gemini Live о его архитектуре или истории — ИИ-помощник даст ответ почти без задержки. В ближайшие недели начнётся процесс глубокой интеграции Gemini Live с другими приложениями: чат-бот сможет составлять маршруты в «Google Картах», создавать события в «Google Календаре» и списки дел в «Google Задачах».

Google активно расширяет возможности Gemini из-за конкурентов, в том числе OpenAI ChatGPT, Apple Siri и других помощников с ИИ. Число чат-ботов постоянно растёт, появляются новые способы взаимодействия с гаджетами и интернетом — под давлением оказываются и продукты крупных компаний, такие как «Google Поиск» и «Google Ассистент». Сегодня, сообщила Google, у Gemini уже 400 млн активных пользователей в месяц, и новые возможности платформы призваны расширить её аудиторию.

Компания представила два тарифных плана подписки на ИИ: Gemini Advanced теперь называется Google AI Pro при той же цене $20 в месяц; в дополнение к ней появилась Google AI Ultra за $250 в месяц — прямой конкурент ChatGPT Pro. Подписчикам Google AI Ultra доступны расширенные лимиты сервисов, они первыми смогут опробовать новые модели и эксклюзивно воспользоваться определёнными функциями. Американские подписчики Pro и Ultra, у которых в Chrome в качестве основного выбран английский язык, получат доступ к Gemini прямо в браузере — ИИ будет составлять сводки информации на страницах и отвечать на вопросы о том, что выведено на экран.

 Источник изображений: blog.google

Расширились возможности агента искусственного интеллекта Gemini Deep Research, который составляет подробные исследовательские отчёты для пользователей — теперь он поддерживает загрузку файлов PDF и изображений. Для составления более персонализированных отчётов он может, например, сверять эти личные файлы PDF с общедоступными данными; на подходе — прямая интеграция Deep Research с Gmail и «Google Диском».

Пользователям бесплатного варианта Gemini открыли доступ к обновлённой модели генерации изображений Imagen 4 — она, по словам Google, более качественно выводит текст. Подписчики Google AI Ultra за $250 в месяц смогут поработать с новейшим генератором видео Veo 3, который в дополнение к изображению теперь генерирует ещё и синхронизированный с картинкой звук. Моделью по умолчанию в Gemini стала Gemini 2.5 Flash — она по сравнению с предшественницей даёт более качественные ответы с меньшей задержкой. Для школьников и студентов Gemini теперь создаёт персонализированные тесты по дисциплинам, которые те хотят более плотно изучить — когда пользователь даёт неправильные ответы, ИИ составляет план действий и генерирует дополнительные тесты, чтобы укрепить знания пользователей в этих областях.

Google добавила ИИ-помощника Gemini в Chrome — он сделает сёрфинг в интернете удобнее

Компания Google объявила об интеграции своего ИИ-помощника Gemini в браузер Chrome. В сообщении разработчиков в блоге Google Labs сказано, что на начальном этапе он сможет «уточнять сложную информацию на любой просматриваемой пользователем веб-странице или обобщать её». В перспективе Gemini сможет одновременно «работать на нескольких вкладках и перемещаться по интернет-сайтам от имени пользователя».

 Источник изображения: Google

Источник изображения: Google

Для начала взаимодействия с Gemini необходимо нажать на значок с изображением искры, который располагается в верхнем правом углу браузера. После этого откроется окно для взаимодействия с ИИ-ботом, которое можно перемещать по экрану и менять его размер. В этом окне пользователь может задавать Gemini вопросы о просматриваемых веб-страницах.

Перед анонсом этого нововведения Google показала журналистам, как работает ИИ-помощник в Chrome. Представитель компании открыл на маркетплейсе страницу туристического спального мешка и попросил Gemini перечислить ключевые характеристики товара. После этого ИИ-помощник изучил веб-страницу и вывел список с основными характеристиками спального мешка. Затем у Gemini спросили, подходит ли этот спальный мешок для кемпинга в штате Мэн (США). Для ответа на этот вопрос алгоритм брал информацию не только на странице товара, но и на других веб-сайтах. Далее представитель Google перешёл на страницу другого спального мешка и попросил сравнить товары, на что Gemini сформировал и предоставил сравнительную таблицу.

На данном этапе пользователи могут взаимодействовать с Gemini, перемещаясь от вкладки к вкладке. Однако позднее в этом году алгоритм научится работать одновременно с несколькими вкладками, предоставляя пользователю информацию с любой из них. В демонстрации для журналистов представитель Google также показал функцию навигации по сайтам с помощью Gemini, которая станет доступной позднее.

Распространение обновления, которое принесёт в Chrome ИИ-помощника Gemini, начинается на этой неделе. В первую очередь его получат пользователи Chrome на Windows и macOS старше 18 лет, для которых английский язык является родным, и у которых есть подписка Google AI Pro или Google AI Ultra. В дополнение к этому ИИ-бот станет доступен пользователям бета-версий Chrome на каналах Dev и Canary. Что касается переноса Gemini в мобильный веб-обозреватель, то Google думает над этим.

Google научила Meet переводить речь «на лету» с сохранением интонаций и тона голоса

Google представила на мероприятии I/O новую функцию «живого» перевода для сервиса видеосвязи Google Meet. Технология, построенная на базе искусственного интеллекта Gemini, преобразует речь пользователя на язык, на котором говорит собеседник, при этом сохраняя интонацию и эмоции. Пока функция доступна в бета-режиме.

 Источник изображения: Google

Источник изображения: Google

В демонстрационном ролике один из участников говорил по-английски, другой — по-испански. После активации функции перевода Gemini каждый слышал речь партнёра на своём языке с невероятной интонационной точностью, пишет The Verge.

Пока система поддерживает только английский и испанский языки. Однако Google уже анонсировала скорое добавление итальянского, немецкого и португальского. По словам компании, новые языки появятся в ближайшие недели.

Аналогичная функция была запущена Microsoft в начале года в приложении для совместной работы Teams, но Google делает акцент на более естественное звучание перевода, подчёркивая, что ИИ не просто переводит текст, а адаптирует голос пользователя так, чтобы его речь звучала органично.

Функция тестируется в бета-режиме для подписчиков Google AI Pro и нового тарифа AI Ultra стоимостью $249 в месяц. Окончательная версия может появиться позднее.

Android-приложения получат доступ к ИИ-модели Gemini Nano, которая работает прямо на смартфоне

Быстрое развитие генеративного искусственного интеллекта радикально изменило продукты технологических гигантов. Большинство новых функций обрабатываются на удалённых серверах, поскольку мобильные устройства располагают весьма ограниченными вычислительными ресурсами. Однако Google готова предоставить разработчикам возможность обращаться и к локальному ИИ — то есть работающему прямо на устройстве.

Google без громких анонсов опубликовала документацию о новых расширенных возможностях ИИ, которыми могут воспользоваться разработчики: в обновлённом ML Kit SDK появилась поддержка API для функций генеративного ИИ на основе локальной языковой модели Gemini Nano. Она построена на платформе AI Core, как и экспериментальный комплект Edge AI SDK, но предполагает подключение к существующей модели с заданным набором функций, которые разработчики смогут легко реализовать.

 Здесь и далее источник изображений: Google

Здесь и далее источник изображений: Google

С ML Kit в приложениях появятся такие функции, как подготовка сводок текста, редактирование, переформулирование, а также описание изображений — всё это без отправки данных в облако. Однако по своим возможностям локальная модель Gemini Nano значительно уступает облачным, поэтому придётся мириться с некоторыми, порой существенными, ограничениями. Например, текстовые сводки могут содержать не более трёх пунктов, а описания изображений доступны только на английском языке. Качество результатов также может различаться в зависимости от версии Gemini Nano, установленной на телефоне. Стандартная Gemini Nano XS занимает около 100 Мбайт, а Gemini Nano XXS, установленная, например, на смартфоне Google Pixel 9a, в четыре раза меньше, работает только с текстом и имеет гораздо меньшее контекстное окно.

Модель Gemini Nano уже используется на устройствах Pixel, а также на смартфонах OnePlus 13, Samsung Galaxy S25 и Xiaomi 15 — их число, вероятно, будет расти, как и количество приложений с функциями локального генеративного ИИ.

Документация для разработчиков уже доступна, и, как ожидается, компания подробнее расскажет об этом проекте на конференции Google I/O. Одна из сессий носит название: «Gemini Nano на Android: разработка с использованием генеративного ИИ на устройстве». До недавнего времени работа с локальным генеративным ИИ на мобильных устройствах была непростой задачей: экспериментальный Edge AI SDK открывает доступ к аппаратному ускорению (NPU) для запуска моделей, но работает только с устройствами серии Pixel 9 и ограничен исключительно текстом. Собственные API для запуска ИИ-нагрузок предлагают также Qualcomm и MediaTek, однако их возможности варьируются от устройства к устройству, что делает их использование в долгосрочных проектах рискованным. К тому же запуск собственной модели ИИ требует серьёзной подготовки, поэтому новые API значительно упростят и ускорят реализацию локального ИИ.

Несмотря на ограниченные возможности локальных моделей на мобильных устройствах, это яркий пример практической пользы ИИ. Большинство пользователей, скорее всего, предпочтут не передавать свои персональные данные на удалённые серверы. Есть и наглядные примеры: функция Google Pixel Screenshots обрабатывает снимки экрана непосредственно на смартфоне, как и сводки по уведомлениям на Motorola Razr Ultra формируются без использования облака — хотя базовая версия Razr всё же обращается к удалённым серверам. Появление API для подключения к Gemini Nano обеспечит некоторую унификацию подходов к мобильному ИИ, но панацеей эта инициатива не станет — многие смартфоны пока не обладают достаточной вычислительной мощностью для таких задач.

YouTube начнёт показывать рекламу рядом с самыми интересными местами видео

На YouTube начнут показывать рекламу сразу после самых ярких и эмоциональных моментов видео. Новый формат таргетинга, получивший название Peak Points, использует искусственный интеллект Gemini для анализа видео и определения сцен с максимальным вовлечением, например, кульминационных или эмоциональных эпизодов. Как только такой момент заканчивается, пользователю покажут рекламное объявление.

 Источник изображения (скриншот): techcrunch.com

Источник изображения (скриншот): techcrunch.com

Peak Points был представлен на недавнем мероприятии Upfront в Нью-Йорке, сообщает TechCrunch. По замыслу YouTube, реклама после «пиковых точек» будет эффективнее запоминаться, так как зрители в этот момент наиболее вовлечены в контент. Этот подход можно сравнить со стратегией, называемой эмоциональным таргетингом, когда рекламодатели стараются представить свою рекламу, характер которой соответствует настроению видео.

Несмотря на то, что обычно любые нововведения являются шагом вперёд, неоднозначность нового формата очевидна: рекламная пауза в самый интересный момент может не всем пользователям понравиться. Многие предпочитают смотреть видео без помех, особенно если оно вызывает сильные эмоции. Пока достоверно неизвестно, можно ли будет отключать или пропускать Peak Points, как обычную рекламу.

Параллельно YouTube представил и более привлекательный для зрителей формат — шоппинг-ленту прямо в рекламе. Теперь во время просмотра ролика можно будет покупать товары, не переходя на другие сайты. По мнению компании, это должно понравиться как рекламодателям, так и пользователям.

Google анонсировала появление ИИ-ассистента Gemini в автомобилях и телевизорах

Компания Google планирует вывести свой ИИ-ассистент Gemini на устройства с Google TV, автомобили с Android Auto, смарт-часы на базе Wear OS, а также гарнитуры смешанной реальности с Android XR. Google не называет конкретных дат, но всё же даёт понять, когда Gemini станет доступен на устройствах разных типов.

 Источник изображения: Google

Источник изображения: Google

В блоге разработчиков Google сообщается, что на телевизорах с Google TV «вы можете запрашивать фильмы, подходящие по возрасту для ваших детей, и получать лучшие рекомендации». В качестве примера рассматривается ситуация, когда пользователь просит Gemini рассказать первокласснику о Солнечной системе. В ответ алгоритм генерирует краткое описание, а при нажатии на кнопку «Узнать больше» можно перейти к просмотру тематических роликов о Солнечной системе на YouTube. ИИ-ассистент Gemini будет интегрирован в Google TV «позднее в этом году».

В автомобилях Gemini сделает помощника Google Assistant более совершенным, благодаря чему тот будет «понимать, чего вы хотите во время движения, благодаря общению на естественном языке». Например, Gemini сможет найти зарядную станцию для электромобиля, расположенную ближе всего по маршруту следования пользователя. Также Gemini будет способен подключаться к приложениям для обмена сообщениями, чтобы обобщать поступающие послания. В Android Auto Gemini появится «в ближайшие месяцы».

В Wear OS ИИ-ассистент позволит пользователям общаться с голосовым помощником на естественном языке, без необходимости подбирать нужные слова или набирать сообщения на маленьком экране смарт-часов. Это может оказаться полезным во многих ситуациях — например, если нужно уточнить какую-либо информацию во время пробежки. Интеграция Gemini с Wear OS будет реализована «в ближайшие месяцы».

Также разработчики сообщили, что Gemini будет встроен в первую гарнитуру на базе Android XR, созданную компанией Samsung. Ожидается, что владельцы этого устройства смогут опробовать ИИ-помощника к концу года.

Google обновила фирменный значок «G» впервые за 10 лет — теперь он градиентный

Предыдущее обновление фирменного стиля Google произошло почти 10 лет назад — 1 сентября 2015 года компания изменила свой логотип, выбрав для его написания шрифт Product Sans. В результате изменений значок из маленькой белой буквы «g» на синем фоне превратился в четырёхцветную заглавную «G», которая без изменений олицетворяла собой Google до сегодняшнего дня. Теперь компания освежила этот логотип, заменив четыре сплошные цветные секции на плавный радужный градиент.

 Источник изображения: Google

Источник изображения: Google

Отныне в значке Google красный плавно переходит в жёлтый, жёлтый в зелёный, а зелёный в синий. По мнению представителей компании, новый вариант выглядит более современным, ярким и красочным. Эта модернизация значка приближает его к градиентному логотипу Gemini, похожий ярлык уже используется для вызова режима искусственного интеллекта в поиске.

В настоящее время новый значок уже используется приложением «Поиск Google» для iOS. В принципе, это довольно незначительное изменение, которое многие пользователи могут просто не заметить.

Похоже, что Google пока не намерена менять свой основной шестибуквенный логотип, в то время как значки многих приложений, скорее всего, могут получить аналогичные градиентные заливки.

Google защитит пользователей Chrome от фишинга с помощью локальной ИИ-модели Gemini Nano

Компания Google представила новые инструменты на базе искусственного интеллекта, направленные на усиление защиты пользователей браузера Chrome от онлайн-мошенничества. Нововведение касается большой языковой модели (LLM) Gemini Nano, работающей локально, непосредственно на устройстве пользователя.

 Источник изображения: AI

Источник изображения: AI

Эта технология, как сообщает TechCrunch, будет использоваться в настольной версии Chrome в режиме расширенной защиты (Enhanced Protection), которая обеспечивает в два раза более высокую безопасность по сравнению со стандартной защитой. Gemini Nano поможет выявлять и блокировать потенциально опасные сайты, в том числе ранее неизвестные и, как отмечают в Google, идеально подходит для этой задачи благодаря своей способности анализировать разнообразную и сложную структуру ресурсов.

Компания также обращает внимание на риски, связанные с уведомлениями от недобросовестных сайтов, которые могут использовать push-уведомления для попыток обмана. Для противостояния этому в мобильной версии Chrome для Android появится новая система предупреждений о таких push, а пользователь сможет выбрать — отключить это уведомление или пройти по ссылке в нём.

Также Google отметила, что уже использует ИИ для борьбы с мошенничеством в поисковой системе. Технологии позволяют ежедневно блокировать сотни миллионов подозрительных результатов. В частности, компания зафиксировала рост числа мошенников, выдающих себя за сотрудников авиакомпаний, и утверждает, что благодаря новым мерам количество подобных случаев удалось сократить более чем на 80 %.

Google обновила ИИ-модель Gemini 2.5 Pro, улучшив её способности в программировании

Google представила улучшенную версию флагманской ИИ-модели — Gemini 2.5 Pro Preview (I/O Edition). По заявлению компании, новая разработка превосходит предыдущие версии в ряде ключевых показателей, включая генерацию программного кода, создание веб-приложений и анализ видео.

 Источник изображения: blog.google

Источник изображения: blog.google

Выход обновлённой версии состоялся накануне ежегодной конференции Google I/O, где компания традиционно представляет новые технологии. В этом году ожидается целая серия премьер, включая другие ИИ-модели и продукты на их основе. Модель уже доступна через Gemini API, а также на платформах Vertex AI и AI Studio, при этом её стоимость осталась на уровне предыдущей версии. Как сообщает TechCrunch, обновление также появится в приложении Gemini для веб- и мобильных устройств.

Среди ключевых улучшений Gemini 2.5 Pro Preview (I/O Edition) — значительно повышенные способности к написанию и редактированию кода, а также разработке сложных агентных рабочих процессов. По словам компании, модель продемонстрировала впечатляющие результаты в создании веб-приложений и возглавила рейтинг WebDev Arena Leaderboard, оценивающий способность ИИ создавать функциональные сайты.

 Источник изображения: blog.google

Источник изображения: blog.google

Кроме того, модель показала рекордные результаты в области анализа видео, набрав 84,8 % в тесте VideoMME — одном из популярных бенчмарков в сфере ИИ. Это расширяет возможности её применения в более сложных сценариях обработки медиаконтента.

«Для разработчиков, уже использующих Gemini 2.5 Pro, новая версия не только улучшит работу с кодом, но и учтёт ключевые пожелания, включая снижение числа ошибок при вызове функций», — говорится в блоге Google. Также отмечается, что модель по умолчанию лучше учитывает эстетическую составляющую при разработке веб-интерфейсов, оставаясь при этом управляемой и гибкой.

Google совсем скоро представит мобильные приложения ИИ-блокнота NotebookLM с офлайн-режимом

20 мая, в день старта конференции Google I/O 2025, дебютируют бета-версии нативных мобильных приложений NotebookLM для iOS и Android, которые придут на смену существующему веб-приложению. Они обеспечат интеграцию ИИ-сервиса с системными функциями мобильных устройств. Приложения будут поддерживать полноценный офлайн-доступ к ранее сгенерированным аудиообзорам, что позволит слушать материалы при отсутствии подключения к интернету. Таким образом, NotebookLM станет по-настоящему мобильным ИИ-инструментом для учёбы, анализа и создания персонализированного контента на ходу.

 Источник изображений: Google

Источник изображений: Google

NotebookLM — это исследовательский инструмент на основе ИИ, вышедший в 2023 году в формате PWA. Несмотря на его широкую функциональность, использование через браузер накладывало свои ограничения: невозможность работы при потере интернет-соединения и отсутствие полноценного фонового воспроизведения аудио. Новые мобильные приложения призваны устранить оба этих недостатка.

Сервис часто описывают как «умный блокнот» нового поколения: пользователи могут загружать в него PDF-файлы, статьи, ссылки на общедоступные видео с YouTube, обычный текст, Google Документы, Google Презентации, аудиофайлы и другие источники информации. ИИ анализирует материалы, выделяет ключевые положения, отвечает на тематические вопросы, а также способен автоматически преобразовывать контент в формат краткого аудиообзора — своеобразного подкаста, созданного по содержанию загруженных данных.

NotebookLM использует новейшие ИИ-модели семейства Gemini. Все ответы сопровождаются ссылками на источники, что позволяет точно видеть, какая информация была извлечена ИИ из загруженных материалов. Благодаря такой достоверности сервис становится незаменимым помощником для студентов, аналитиков, исследователей и всех, кому необходим точный и проверяемый фактологический материал.

Функциональность включает полноценный офлайн-режим. Можно заранее скачать аудиообзоры, созданные ИИ, и прослушивать их без подключения к интернету. Благодаря фоновому воспроизведению, аудио продолжает играть, даже если пользователь переключился на другое приложение или заблокировал экран.

 Источник изображений: Google

Судя по скриншотам из Google «Play Маркет», интерфейс приложения будет содержать ряд дополнительных функций, часть из которых знакома пользователям веб-версии:

  • Главный экран (Home screen). Отображаются вкладки «Недавние» (Recent), «Общие» (Shared), «Название» (Title) и «Загруженные» (Downloaded), а также прокручиваемый список тетрадей. Каждая тетрадь имеет большую кнопку для запуска «Аудиообзора» (Audio Overview).
  • Аудиоплеер (Audio player): Это полноэкранный режим, который не только показывает анимированную форму волны, но и позволяет вам «присоединиться к подкасту», чтобы задать ИИ вопросы или получить пояснения.
  • Создание новой тетради. Большая плавающая кнопка действия в нижней части экрана позволяет создать новую тетрадь. Достаточно нажать на неё, чтобы загрузить документы, вставить текст, добавить URL-адреса — или воспользоваться функцией системного общего доступа, чтобы импортировать содержимое из других приложений непосредственно в NotebookLM.
  • Режим просмотра тетради. При открытии тетради в нижней части экрана отображается постоянная панель инструментов, обеспечивающая быстрый доступ к разделу «Источники» (Sources) (просмотр загруженных материалов), «Чат» (Chat) (взаимодействие с ИИ по содержанию тетради) и «Студия» (Studio) (настройки и статистика использования).

Скриншоты также демонстрируют, как приложение выглядит на планшетах: в режиме разделённого экрана чат с ИИ располагается рядом со списком источников — как при работе на ноутбуке.

 Источник изображений: Google

Нативные приложения обеспечивают более глубокую интеграцию с системами iOS и Android и доступ к системным функциям, таким как push-уведомления. Пользователи смогут получить доступ к новому приложению, выполнив следующие действия:

  1. Предварительная регистрация: Зайдите в Apple App Store или Google «Play Маркет» нажмите «Предзаказ» (Pre-order) или «Предварительная регистрация» (Pre-register).
  2. Автоматическая загрузка: 20 мая (в первый день Google I/O 2025) ваш смартфон автоматически загрузит приложение.
  3. Войти: Откройте приложение, войдите в него с помощью учетной записи Google, и всё готово.
  4. Обновите приложение до NotebookLM Plus (по желанию): Не забывайте, что существует приложение NotebookLM Plus, доступное в Google One AI Premium. В нём есть всё, что предлагает NotebookLM, плюс в 5 раз больше аудиообзоров, запросов и источников для каждого блокнота, возможность настраивать стиль и длину ответов в блокноте, а также возможность делиться блокнотами с командой.

Google откроет Gemini доступ ко всей информации о пользователях, которую она накопила

Гонка чат-ботов с искусственным интеллектом накаляется, и теперь Google собирается дать Gemini возможность понять пользователя как, возможно, никто другой. Gemini сможет не только запоминать предыдущие разговоры с человеком, но также учиться на его действиях в других приложениях: Gmail, «Google Календарь» и YouTube, сообщил президент Google Labs и Gemini Джош Вудворд (Josh Woodward).

 Источник изображения: blog.google

Источник изображения: blog.google

В апреле OpenAI объявила, что значительно расширит память ChatGPT, позволит помощнику обращаться к прошлой переписке с пользователем и использовать эту информацию для персонализации последующих ответов. Такие ответы, по мнению компании, будут в большей степени соответствовать его интересам, привычкам и предпочтениям, обеспечивая более комфортное и полезное взаимодействие.

В Google решили на этом не останавливаться. В ближайшее время компания откроет Gemini доступ к истории прошлых чатов пользователя и ИИ, а после этого развернёт функцию pcontext, что означает «персонализированный контекст». Пока эта функция тестируется внутри компании. Она предназначена для извлечения информации из учётной записи пользователя в экосистеме Google, что обеспечит Gemini глубокое понимание жизни пользователя: упоминаются, в частности, Gmail, «Google Фото», «Google Календарь», «Google Поиск» и YouTube. Компания намеревается сделать Gemini более активным, но не уточнила, что именно имеется в виду. Возможно, помощник с ИИ будет по собственной инициативе выдвигать полезные предложения с учётом расписания, истории веб-поиска и активности в почтовом ящике пользователя.

Настолько глубокая интеграция, конечно, поднимает вопрос о конфиденциальности. Google и без того хранит чрезвычайно много информации о пользователях, а открытие её системе ИИ и возможность совершать операции с этими данными — очередной шаг вперёд. Поэтому в компании заверили, что будут запрашивать у пользователей явное разрешение, прежде чем Gemini получит доступ к этим данным. Это шаг к тому, чтобы сделать Gemini более «личным, проактивным и мощным», уверен господин Вудворд. И намекнул, что скоро появится новая информация.

Google научила ИИ-бота Gemini редактировать любые изображения

Google Gemini научился редактировать как сгенерированные ИИ изображения, так и загруженные со смартфона или компьютера. В ближайшие недели новая функциональность станет доступна пользователям в большинстве стран мира, где доступен Gemini, и получит поддержку более чем 45 языков. Россия, напомним, в этот список не входит, однако русский язык Gemini понимает и «говорит» на нём.

 Источник изображений: Google

Источник изображений: Google

Нативное редактирование изображений в ИИ-чат-боте Gemini представляет собой эволюционный шаг в развитии возможностей взаимодействия пользователя с ИИ. Запуск последовал за моделью редактирования изображений с помощью ИИ, которую Google опробовала в марте в своей платформе AI Studio и которая получила широкую огласку благодаря своей спорной способности удалять водяные знаки с любого изображения. Подобно недавно обновлённому инструменту редактирования изображений в ChatGPT, встроенный редактор Gemini теоретически способен достигать более высоких результатов по сравнению с автономными ИИ-генераторами изображений.

Теперь Gemini предлагает инновационный «многоэтапный» процесс редактирования, обеспечивающий, по описанию компании, «более богатые и контекстуальные» отклики на каждый запрос — с интеграцией текста и изображений. Функциональность нового редактора позволяет пользователям изменять фон на изображениях, заменять объекты, добавлять элементы и выполнять множество других операций — и всё это непосредственно в интерфейсе Gemini. Подобное решение существенно упрощает процесс создания и редактирования визуального контента, устраняя необходимость переключаться между несколькими специализированными приложениями.

 Источник изображений: Google

«Например, вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос. Также можно попросить Gemini создать первый черновик сказки на ночь о драконах и сгенерировать иллюстрации к истории», — поясняет Google в своём блоге. Эти примеры наглядно демонстрируют многофункциональность системы, пригодной как для утилитарных, так и для креативных задач.

Потенциальные риски технологии в контексте создания дипфейков обоснованно вызывают опасения у специалистов по информационной безопасности. Чтобы нивелировать возможные злоупотребления, Google внедряет технологию невидимых водяных знаков во все изображения, созданные или отредактированные с помощью нативного генератора изображений Gemini. Параллельно компания проводит экспериментальные исследования по внедрению видимых водяных знаков на всех изображениях, сгенерированных с помощью Gemini.

Google подтвердила, что близка к внедрению ИИ-модели Gemini в iPhone

Генеральный директор Google Сундар Пичаи (Sundar Pichai) заявил, что компания близка к соглашению с Apple о внедрении модели искусственного интеллекта Gemini в iPhone. Это позволит Siri использовать широкие возможности ИИ-модели для ответов на более сложные вопросы.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Ещё в июне прошлого года старший вице-президент Apple Крейг Федериги (Craig Federighi) намекал на возможность интеграции, говоря, что компания хотела бы, чтобы в будущем у пользователей была возможность выбора между ИИ-моделями, включая Google Gemini. В настоящий момент добавлена только поддержка чат-бота от OpenAI в систему Apple Intelligence, которая перенаправляет сложные запросы в ChatGPT, если они выходят за рамки её возможностей, отмечает The Verge.

Пичаи подтвердил, что обсуждал вопрос интеграции с главой Apple Тимом Куком (Tim Cook), а он, в свою очередь, интересовался планами разработки и продвижения Gemini, и также подтвердил, что его компания намерена добавить уже в этом году в Apple Intelligence больше сторонних ИИ-моделей.

Если сделка состоится (предположительно к концу 2025 года), Gemini станет второй сторонней ИИ-системой, доступной в экосистеме Apple, и даст пользователям возможность выбора между технологиями OpenAI и Google, а также усилит конкуренцию в области искусственного интеллекта.


window-new
Soft
Hard
Тренды 🔥
Ubisoft проговорилась о сериале Far Cry от создателей «Фарго» и «В Филадельфии всегда солнечно» 13 мин.
VI Форум «Мой бизнес» в Архангельске: предприниматели, эксперты и представители власти обсудят рост в новых условиях 2 ч.
«Странно для публичной компании отказываться от лёгких денег»: Electronic Arts забраковала ремейк Dragon Age: Origins и ремастер трилогии 3 ч.
Открытый бета-тест Battlefield 6 стал крупнейшим в серии — шутер вошёл в топ-20 самых популярных игр Steam 13 ч.
Поумневшая Siri появится только к весне 2026 года — вместе с углубленной интеграцией сторонних приложений 17 ч.
Хакеры заполонили Facebook замаскированными в SVG-изображениях вирусами 18 ч.
ИИ в Firefox загружает CPU до предела и быстро разряжает ноутбуки, пожаловались пользователи 22 ч.
Новая статья: Of Ash and Steel — от фанатов для фанатов. Предварительный обзор 10-08 00:10
Google выпустит «Булочку с корицей» — такое имя получила Android 17 09-08 21:12
Учёные создали редактор для визуализации «физически невозможных» объектов 09-08 19:25