Сегодня 23 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → google gemini
Быстрый переход

В Google разработали инструмент для выявления контента, сгенерированного ИИ

Компания Google анонсировала на конференции Google I/O новый инструмент SynthID Detector, который позволяет узнать, был ли контент создан с помощью инструментов искусственного интеллекта. Сервис анализирует изображения, текст, аудио и видео на наличие скрытых водяных меток, которые автоматически добавляются в материалы, сгенерированные с помощью ИИ, включая модели компании — Gemini, Imagen, Lyria и Veo.

 Источник изображения: Sascha Bosshard / Unsplash

Источник изображения: Sascha Bosshard / Unsplash

Как объяснил руководитель Google DeepMind Пушмит Коли (Pushmeet Kohli), система определяет, какие именно части контента содержат маркировку. Например, в аудио SynthID Detector находит и отмечает конкретные временные отрезки, а в изображениях — области с наибольшей вероятностью наличия водяного знака.

Сейчас система тестируется среди ограниченного круга пользователей. Но после первого этапа тестирования доступ постепенно получат те, кто подал заявку через «Лист ожидания» (SynthID Detector Waitlist). По словам Коли, компания планирует также использовать обратную связь с пользователями, чтобы улучшить систему идентификации ИИ-контента.

На данный момент SynthID Detector работает только с контентом, созданным с помощью продуктов Google. Однако в будущем компания рассматривает возможность расширения функциональности для работы с другими ИИ-системами. Когда именно инструмент станет доступен всем — пока неизвестно.

Google добавила в Gmail, «Документы» и Vids новые ИИ-функции

На конференции Google I/O 2025 компания представила множество новых функций на основе искусственного интеллекта для приложений из рабочего комплекта Workspace — изменения коснулись сервисов Gmail, «Google Документы» и видеоредактора Google Vids.

 Источник изображений: Google

Источник изображений: Google

Функция персонализированных интеллектуальных ответов Gmail помогает в составлении писем с учётом контекста и тона — система анализирует предыдущую переписку, файлы в облачном хранилище «Google Диск» и готовит ответы с актуальными данными. Манера письма подстраивается под тон пользователя — формальный или разговорный. С функцией очистки входящих сообщений ИИ-помощник Gemini принимает решения об удалении или перемещении в архив писем, которые больше не нужны — достаточно, например, в свободной форме дать ему команду удалить все непрочитанные письма от определённого адресата за минувший год.

Ещё одна новая возможность Gmail помогает оперативно планировать встречи и совещания с адресатами вне организации пользователя. Он назначает время встречи или совещания при участии Gemini — это, по словам Google, сокращает время и усилия, которые традиционно тратятся на сверку расписаний. Все эти новые функции почтовой службы станут общедоступными в ближайшие месяцы.

 Источник изображений: Google

В «Google Документах» появилась возможность устанавливать прямую связь приложения с данными презентаций, таблиц и отчётов — помогая в написании документов, Gemini берёт в качестве исходной информации только эти источники, то есть генерируемый системой текст основывается только на надёжном материале. Функция уже вышла в общий доступ.

Редактор Google Vids получил возможность превращать существующие документы «Google Презентаций» в видео. Gemini предлагает помощь в составлении сценариев, может сгенерировать закадровый голос, анимации и многое другое — функция станет общедоступной в ближайшие месяцы. В Google Vids появились ИИ-аватары, которые пригодятся компаниям, не располагающими средствами для съёмки видео или привлечения диктора. Можно подготовить сценарий и выбрать аватар, который зачитает сообщение в специально подготовленном видео — это пригодится для корпоративных объявлений, создании справки по продуктам и в других целях. ИИ-аватары выйдут в общий доступ в июне.

Ещё одна новая функция Google Vids — «Обрезка стенограммы» (Transcript trim), предполагающая автоматическое удаление из выступлений слов-паразитов и лишних междометий. Для регулирования уровня звука пригодится функция «Сбалансировать звук» (Balance sound) — она выйдет в общий доступ в июне; «Обрезка стенограммы» появится в экспериментальном разделе Labs в ближайшие месяцы. Наконец, более качественные иллюстрации в документах теперь помогает создавать новая версия генератора изображений Imagen 4, доступ к которой открылся в рабочих приложениях.

Google анонсировала запуск AI Mode — ИИ-поиск будущего с анализом данных, графиками и 3D-примеркой

Google объявила о масштабном запуске расширенного поиска с ИИ AI Mode, который позволяет задавать сложные, многоуровневые вопросы и получать развёрнутые ответы с анализом данных. Функция начнёт появляться у пользователей в США, а затем станет доступна во всём мире.

 Источник изображения: Google

Источник изображений: Google

AI Mode строится на основе существующего инструмента AI Overviews, который показывает краткие ИИ-сводки в начале поисковой выдачи. Несмотря на отдельные казусы прошлого, например, совет использовать клей вместо соуса для пиццы, этот формат быстро набрал популярность. По статистике им ежемесячно пользуются более 1,5 миллиарда человек. Как отмечает TechCrunch, теперь AI Overviews выйдет из тестового режима, расширится на 200 стран и получит поддержку более 40 языков.

Новый AI Mode предназначен для сложных запросов, включая сравнение товаров и анализ данных. Он использует технологию Deep Search, которая разбивает вопрос на подтемы и обрабатывает десятки, а то и сотни запросов, чтобы сформировать детальный отчёт со ссылками на источники. Google утверждает, что это реально экономит часы ручного поиска.

Также анонсирован автоматический помощник для покупок, который сможет отслеживать цену на товар и, в случае снижения, уведомить о возможности покупки. Ещё появится функция виртуальной примерки одежды. Пользователи смогут загружать свои фото, а ИИ будет «надевать» на них выбранные вещи в 3D-формате, учитывая комплекцию человека и тип ткани одежды. Функция начнёт тестироваться в Search Labs с сегодняшнего дня.

Для обработки информации в AI Mode и AI Overviews используется специальная версия модели Gemini 2.5. В будущем часть функций AI Mode постепенно перейдёт и в AI Overviews. Пользователи смогут задавать вопросы, например, из сферы спорта и финансов, и получать в ответ не просто цифры, а визуализированные графики и таблицы.

Ещё одно нововведение касается интеграции ИИ-агента Project Mariner, который может самостоятельно бронировать билеты, столики в ресторанах и находить в интернете различные мероприятия. А позднее выйдет Search Live — «Живой поиск» — с помощью которого пользователи смогут задавать вопросы посредством камеры смартфона, а ИИ будет отвечать в реальном режиме времени подобно системе мультимодального ИИ-помощника Project Astra.

Также будет усилена персонализация. Если подключить Gmail (или другой сервис Google), поисковик будет учитывать предпочтения пользователя и предлагать результаты на основе писем электронной почты. При этом пользователь сам решает, какие приложения подключать, а какие — нет.

Google мощно обновила приложение Gemini: изучение мира в реальном времени, улучшенный Deep Research и многое другое

Google рассказала на конференции Google I/O 2025 о новых возможностях чат-бота Gemini с искусственным интеллектом: расширились мультимодальные функции платформы, открылся доступ к новым моделям ИИ, готовится глубокая интеграция с сервисами Google.

 Источник изображений: blog.google

Источник изображений: blog.google

В очередном обновлении приложения расширились функции Gemini Live для всех её пользователей под Google Android и Apple iOS. Теперь можно беседовать с Gemini в режиме, близком к реальному времени, одновременно транслируя ИИ видео с камеры или экрана смартфона. Во время прогулки по незнакомому городу можно направить камеру телефона на одно из зданий и спросить у Gemini Live о его архитектуре или истории — ИИ-помощник даст ответ почти без задержки. В ближайшие недели начнётся процесс глубокой интеграции Gemini Live с другими приложениями: чат-бот сможет составлять маршруты в «Google Картах», создавать события в «Google Календаре» и списки дел в «Google Задачах».

Google активно расширяет возможности Gemini из-за конкурентов, в том числе OpenAI ChatGPT, Apple Siri и других помощников с ИИ. Число чат-ботов постоянно растёт, появляются новые способы взаимодействия с гаджетами и интернетом — под давлением оказываются и продукты крупных компаний, такие как «Google Поиск» и «Google Ассистент». Сегодня, сообщила Google, у Gemini уже 400 млн активных пользователей в месяц, и новые возможности платформы призваны расширить её аудиторию.

Компания представила два тарифных плана подписки на ИИ: Gemini Advanced теперь называется Google AI Pro при той же цене $20 в месяц; в дополнение к ней появилась Google AI Ultra за $250 в месяц — прямой конкурент ChatGPT Pro. Подписчикам Google AI Ultra доступны расширенные лимиты сервисов, они первыми смогут опробовать новые модели и эксклюзивно воспользоваться определёнными функциями. Американские подписчики Pro и Ultra, у которых в Chrome в качестве основного выбран английский язык, получат доступ к Gemini прямо в браузере — ИИ будет составлять сводки информации на страницах и отвечать на вопросы о том, что выведено на экран.

 Источник изображений: blog.google

Расширились возможности агента искусственного интеллекта Gemini Deep Research, который составляет подробные исследовательские отчёты для пользователей — теперь он поддерживает загрузку файлов PDF и изображений. Для составления более персонализированных отчётов он может, например, сверять эти личные файлы PDF с общедоступными данными; на подходе — прямая интеграция Deep Research с Gmail и «Google Диском».

Пользователям бесплатного варианта Gemini открыли доступ к обновлённой модели генерации изображений Imagen 4 — она, по словам Google, более качественно выводит текст. Подписчики Google AI Ultra за $250 в месяц смогут поработать с новейшим генератором видео Veo 3, который в дополнение к изображению теперь генерирует ещё и синхронизированный с картинкой звук. Моделью по умолчанию в Gemini стала Gemini 2.5 Flash — она по сравнению с предшественницей даёт более качественные ответы с меньшей задержкой. Для школьников и студентов Gemini теперь создаёт персонализированные тесты по дисциплинам, которые те хотят более плотно изучить — когда пользователь даёт неправильные ответы, ИИ составляет план действий и генерирует дополнительные тесты, чтобы укрепить знания пользователей в этих областях.

Google обновила фирменный значок «G» впервые за 10 лет — теперь он градиентный

Предыдущее обновление фирменного стиля Google произошло почти 10 лет назад — 1 сентября 2015 года компания изменила свой логотип, выбрав для его написания шрифт Product Sans. В результате изменений значок из маленькой белой буквы «g» на синем фоне превратился в четырёхцветную заглавную «G», которая без изменений олицетворяла собой Google до сегодняшнего дня. Теперь компания освежила этот логотип, заменив четыре сплошные цветные секции на плавный радужный градиент.

 Источник изображения: Google

Источник изображения: Google

Отныне в значке Google красный плавно переходит в жёлтый, жёлтый в зелёный, а зелёный в синий. По мнению представителей компании, новый вариант выглядит более современным, ярким и красочным. Эта модернизация значка приближает его к градиентному логотипу Gemini, похожий ярлык уже используется для вызова режима искусственного интеллекта в поиске.

В настоящее время новый значок уже используется приложением «Поиск Google» для iOS. В принципе, это довольно незначительное изменение, которое многие пользователи могут просто не заметить.

Похоже, что Google пока не намерена менять свой основной шестибуквенный логотип, в то время как значки многих приложений, скорее всего, могут получить аналогичные градиентные заливки.

Google совсем скоро представит мобильные приложения ИИ-блокнота NotebookLM с офлайн-режимом

20 мая, в день старта конференции Google I/O 2025, дебютируют бета-версии нативных мобильных приложений NotebookLM для iOS и Android, которые придут на смену существующему веб-приложению. Они обеспечат интеграцию ИИ-сервиса с системными функциями мобильных устройств. Приложения будут поддерживать полноценный офлайн-доступ к ранее сгенерированным аудиообзорам, что позволит слушать материалы при отсутствии подключения к интернету. Таким образом, NotebookLM станет по-настоящему мобильным ИИ-инструментом для учёбы, анализа и создания персонализированного контента на ходу.

 Источник изображений: Google

Источник изображений: Google

NotebookLM — это исследовательский инструмент на основе ИИ, вышедший в 2023 году в формате PWA. Несмотря на его широкую функциональность, использование через браузер накладывало свои ограничения: невозможность работы при потере интернет-соединения и отсутствие полноценного фонового воспроизведения аудио. Новые мобильные приложения призваны устранить оба этих недостатка.

Сервис часто описывают как «умный блокнот» нового поколения: пользователи могут загружать в него PDF-файлы, статьи, ссылки на общедоступные видео с YouTube, обычный текст, Google Документы, Google Презентации, аудиофайлы и другие источники информации. ИИ анализирует материалы, выделяет ключевые положения, отвечает на тематические вопросы, а также способен автоматически преобразовывать контент в формат краткого аудиообзора — своеобразного подкаста, созданного по содержанию загруженных данных.

NotebookLM использует новейшие ИИ-модели семейства Gemini. Все ответы сопровождаются ссылками на источники, что позволяет точно видеть, какая информация была извлечена ИИ из загруженных материалов. Благодаря такой достоверности сервис становится незаменимым помощником для студентов, аналитиков, исследователей и всех, кому необходим точный и проверяемый фактологический материал.

Функциональность включает полноценный офлайн-режим. Можно заранее скачать аудиообзоры, созданные ИИ, и прослушивать их без подключения к интернету. Благодаря фоновому воспроизведению, аудио продолжает играть, даже если пользователь переключился на другое приложение или заблокировал экран.

 Источник изображений: Google

Судя по скриншотам из Google «Play Маркет», интерфейс приложения будет содержать ряд дополнительных функций, часть из которых знакома пользователям веб-версии:

  • Главный экран (Home screen). Отображаются вкладки «Недавние» (Recent), «Общие» (Shared), «Название» (Title) и «Загруженные» (Downloaded), а также прокручиваемый список тетрадей. Каждая тетрадь имеет большую кнопку для запуска «Аудиообзора» (Audio Overview).
  • Аудиоплеер (Audio player): Это полноэкранный режим, который не только показывает анимированную форму волны, но и позволяет вам «присоединиться к подкасту», чтобы задать ИИ вопросы или получить пояснения.
  • Создание новой тетради. Большая плавающая кнопка действия в нижней части экрана позволяет создать новую тетрадь. Достаточно нажать на неё, чтобы загрузить документы, вставить текст, добавить URL-адреса — или воспользоваться функцией системного общего доступа, чтобы импортировать содержимое из других приложений непосредственно в NotebookLM.
  • Режим просмотра тетради. При открытии тетради в нижней части экрана отображается постоянная панель инструментов, обеспечивающая быстрый доступ к разделу «Источники» (Sources) (просмотр загруженных материалов), «Чат» (Chat) (взаимодействие с ИИ по содержанию тетради) и «Студия» (Studio) (настройки и статистика использования).

Скриншоты также демонстрируют, как приложение выглядит на планшетах: в режиме разделённого экрана чат с ИИ располагается рядом со списком источников — как при работе на ноутбуке.

 Источник изображений: Google

Нативные приложения обеспечивают более глубокую интеграцию с системами iOS и Android и доступ к системным функциям, таким как push-уведомления. Пользователи смогут получить доступ к новому приложению, выполнив следующие действия:

  1. Предварительная регистрация: Зайдите в Apple App Store или Google «Play Маркет» нажмите «Предзаказ» (Pre-order) или «Предварительная регистрация» (Pre-register).
  2. Автоматическая загрузка: 20 мая (в первый день Google I/O 2025) ваш смартфон автоматически загрузит приложение.
  3. Войти: Откройте приложение, войдите в него с помощью учетной записи Google, и всё готово.
  4. Обновите приложение до NotebookLM Plus (по желанию): Не забывайте, что существует приложение NotebookLM Plus, доступное в Google One AI Premium. В нём есть всё, что предлагает NotebookLM, плюс в 5 раз больше аудиообзоров, запросов и источников для каждого блокнота, возможность настраивать стиль и длину ответов в блокноте, а также возможность делиться блокнотами с командой.

Google откроет Gemini доступ ко всей информации о пользователях, которую она накопила

Гонка чат-ботов с искусственным интеллектом накаляется, и теперь Google собирается дать Gemini возможность понять пользователя как, возможно, никто другой. Gemini сможет не только запоминать предыдущие разговоры с человеком, но также учиться на его действиях в других приложениях: Gmail, «Google Календарь» и YouTube, сообщил президент Google Labs и Gemini Джош Вудворд (Josh Woodward).

 Источник изображения: blog.google

Источник изображения: blog.google

В апреле OpenAI объявила, что значительно расширит память ChatGPT, позволит помощнику обращаться к прошлой переписке с пользователем и использовать эту информацию для персонализации последующих ответов. Такие ответы, по мнению компании, будут в большей степени соответствовать его интересам, привычкам и предпочтениям, обеспечивая более комфортное и полезное взаимодействие.

В Google решили на этом не останавливаться. В ближайшее время компания откроет Gemini доступ к истории прошлых чатов пользователя и ИИ, а после этого развернёт функцию pcontext, что означает «персонализированный контекст». Пока эта функция тестируется внутри компании. Она предназначена для извлечения информации из учётной записи пользователя в экосистеме Google, что обеспечит Gemini глубокое понимание жизни пользователя: упоминаются, в частности, Gmail, «Google Фото», «Google Календарь», «Google Поиск» и YouTube. Компания намеревается сделать Gemini более активным, но не уточнила, что именно имеется в виду. Возможно, помощник с ИИ будет по собственной инициативе выдвигать полезные предложения с учётом расписания, истории веб-поиска и активности в почтовом ящике пользователя.

Настолько глубокая интеграция, конечно, поднимает вопрос о конфиденциальности. Google и без того хранит чрезвычайно много информации о пользователях, а открытие её системе ИИ и возможность совершать операции с этими данными — очередной шаг вперёд. Поэтому в компании заверили, что будут запрашивать у пользователей явное разрешение, прежде чем Gemini получит доступ к этим данным. Это шаг к тому, чтобы сделать Gemini более «личным, проактивным и мощным», уверен господин Вудворд. И намекнул, что скоро появится новая информация.

Google научила ИИ-бота Gemini редактировать любые изображения

Google Gemini научился редактировать как сгенерированные ИИ изображения, так и загруженные со смартфона или компьютера. В ближайшие недели новая функциональность станет доступна пользователям в большинстве стран мира, где доступен Gemini, и получит поддержку более чем 45 языков. Россия, напомним, в этот список не входит, однако русский язык Gemini понимает и «говорит» на нём.

 Источник изображений: Google

Источник изображений: Google

Нативное редактирование изображений в ИИ-чат-боте Gemini представляет собой эволюционный шаг в развитии возможностей взаимодействия пользователя с ИИ. Запуск последовал за моделью редактирования изображений с помощью ИИ, которую Google опробовала в марте в своей платформе AI Studio и которая получила широкую огласку благодаря своей спорной способности удалять водяные знаки с любого изображения. Подобно недавно обновлённому инструменту редактирования изображений в ChatGPT, встроенный редактор Gemini теоретически способен достигать более высоких результатов по сравнению с автономными ИИ-генераторами изображений.

Теперь Gemini предлагает инновационный «многоэтапный» процесс редактирования, обеспечивающий, по описанию компании, «более богатые и контекстуальные» отклики на каждый запрос — с интеграцией текста и изображений. Функциональность нового редактора позволяет пользователям изменять фон на изображениях, заменять объекты, добавлять элементы и выполнять множество других операций — и всё это непосредственно в интерфейсе Gemini. Подобное решение существенно упрощает процесс создания и редактирования визуального контента, устраняя необходимость переключаться между несколькими специализированными приложениями.

 Источник изображений: Google

«Например, вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос. Также можно попросить Gemini создать первый черновик сказки на ночь о драконах и сгенерировать иллюстрации к истории», — поясняет Google в своём блоге. Эти примеры наглядно демонстрируют многофункциональность системы, пригодной как для утилитарных, так и для креативных задач.

Потенциальные риски технологии в контексте создания дипфейков обоснованно вызывают опасения у специалистов по информационной безопасности. Чтобы нивелировать возможные злоупотребления, Google внедряет технологию невидимых водяных знаков во все изображения, созданные или отредактированные с помощью нативного генератора изображений Gemini. Параллельно компания проводит экспериментальные исследования по внедрению видимых водяных знаков на всех изображениях, сгенерированных с помощью Gemini.

Google подтвердила, что близка к внедрению ИИ-модели Gemini в iPhone

Генеральный директор Google Сундар Пичаи (Sundar Pichai) заявил, что компания близка к соглашению с Apple о внедрении модели искусственного интеллекта Gemini в iPhone. Это позволит Siri использовать широкие возможности ИИ-модели для ответов на более сложные вопросы.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Ещё в июне прошлого года старший вице-президент Apple Крейг Федериги (Craig Federighi) намекал на возможность интеграции, говоря, что компания хотела бы, чтобы в будущем у пользователей была возможность выбора между ИИ-моделями, включая Google Gemini. В настоящий момент добавлена только поддержка чат-бота от OpenAI в систему Apple Intelligence, которая перенаправляет сложные запросы в ChatGPT, если они выходят за рамки её возможностей, отмечает The Verge.

Пичаи подтвердил, что обсуждал вопрос интеграции с главой Apple Тимом Куком (Tim Cook), а он, в свою очередь, интересовался планами разработки и продвижения Gemini, и также подтвердил, что его компания намерена добавить уже в этом году в Apple Intelligence больше сторонних ИИ-моделей.

Если сделка состоится (предположительно к концу 2025 года), Gemini станет второй сторонней ИИ-системой, доступной в экосистеме Apple, и даст пользователям возможность выбора между технологиями OpenAI и Google, а также усилит конкуренцию в области искусственного интеллекта.

Google Gemini поможет в практике иностранных языков — есть и поддержка русского

Google выпустила три экспериментальных проекта на основе технологий искусственного интеллекта, предназначенные для помощи пользователям в изучении иностранных языков. Разработка решений находится на ранних этапах, но большая языковая модель Gemini уже сейчас становится грозным конкурентом Duolingo.

 Источник изображений: googleblog.com

Источник изображений: googleblog.com

Первый экспериментальный проект направлен на быстрое изучение определённых фраз, которые нужны пользователю в данный момент; второй предназначен для того, чтобы сформировать у обучаемого менее формальные навыки иностранного языка и выработать у него манеру общения, более свойственную местным жителям. Третий экспериментальный проект предполагает подключение камеры для формирования нового лексикона на основе окружающих предметов.

Один из наиболее неприятных аспектов при изучении иностранного языка, отмечают в Google, — оказаться в ситуации, когда нужна конкретная фраза, но она ещё не изучена. Экспериментальная функция Tiny Lesson позволяет описать ситуацию, например, «поиски утерянного паспорта» и получить рекомендации по словарному запасу и грамматике, адаптированные к контексту, например: «Я не знаю, где его потерял» или «Я хочу сообщить об этом в полицию».

Вторая экспериментальная функция получила название Slang Hang, её задача — сделать речь обучающегося менее «учебной», то есть менее формальной, более разговорной и обогащённой местным сленгом. Можно смоделировать реалистичный разговор между носителями языка и по каждой реплике проследить, как разворачивается диалог. Это может быть, например, разговор покупателя с уличным торговцем или сценарий встречи двух давно потерявших друг друга приятелей в метро. В рамках этого экспериментального проекта, признались в Google, ИИ иногда неправильно применяет сленг, поэтому его рекомендации лучше сопоставлять с надёжными источниками.

 Источник изображений: googleblog.com

Третий эксперимент получил название Word Cam: пользователь делает снимок окружающих его предметов, Gemini их распознаёт и предлагает названия на изучаемом языке. Иногда на практике требуется знать, как называются предметы вокруг, и эта функция может продемонстрировать, что пользователь ещё многого не изучил. Например, можно знать слово «окно», но не «жалюзи». Идея этих проектов состоит в том, чтобы обозначить новые варианты использования ИИ, сделать самостоятельное изучение языков более динамичным и личностно ориентированным.

Новые экспериментальные функции Google Gemini способны помочь в изучении следующих языков: арабский, китайский (материковый Китай, Гонконг, Тайвань), английский (Австралия, Великобритания, США), французский (Канада, Франция), немецкий, греческий, иврит, хинди, итальянский, японский, корейский, португальский (Бразилия, Португалия), русский, испанский (Латинская Америка, Испания) и турецкий. Доступ к ним открывается через платформу Google Labs.

Google готовит Gemini для детей — ИИ будет под контролем родителей

Google собирается открыть доступ к помощнику с искусственным интеллектом Gemini для детей до 13 лет, чьи устройства контролируются родителями с помощью приложения Family Link. Компания предупредила, что ИИ может вести себя непредсказуемо.

 Источник изображения: blog.google

Источник изображения: blog.google

Google сообщила о намерении выпустить детский вариант Gemini — для этой аудитории предлагаются такие варианты использования, как помощь с домашними заданиями, ответы на вопросы и генерация сказок с учётом возраста ребёнка. Дети смогут взаимодействовать с ИИ-помощником в приложениях для Android, iOS, а также в веб-версии Gemini; на Android службу можно будет установить в качестве помощника по умолчанию.

Учитывая непредсказуемость современных моделей ИИ, Google предупредила пользователей, что «Gemini может допускать ошибки», и порекомендовала родителям научить детей «относиться к ответам Gemini критически». В компании подчеркнули, что ребёнок должен понимать: Gemini — не человек; он может отвечать, как человек, но не обладает сознанием и эмоциями. Поэтому ребёнку следует проверять получаемую информацию и не доверять ИИ конфиденциальные данные. Родителям также стоит учитывать, что механизмы ограничения контента у ИИ не совершенны, и Gemini потенциально может продемонстрировать нежелательные материалы. В связи с этим контроль над системой будет осуществляться через приложение Family Link. О сроках развёртывания детской версии Gemini Google пообещала сообщить дополнительно.

ИИ-помощник Google Gemini появится в автомобилях, умных часах и наушниках

В последние пару лет Google активно интегрирует чат-бота Gemini с искусственным интеллектом в свои продукты: в Gmail, Android, «Google Диск» и другие сервисы. К концу года присутствие чат-бота расширится — он появится на платформе Wear OS для умных часов, Android Auto для автомобилей и в беспроводных наушниках.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе брифинга после квартального финансового отчёта гендиректор холдинга Alphabet Сундар Пичаи (Sundar Pichai) объявил, что в скором времени Gemini появится на новых устройствах: «Мы обновим Google Assistant на мобильных устройствах до Gemini, а позже в этом году обновим планшеты, автомобили и устройства, которые подключаются к смартфону, такие как наушники и часы». В этом году конференция разработчиков Google I/O запланирована на 20–21 мая — возможно, на ней компания подробнее расскажет о своих планах расширить присутствие Gemini.

Google Gemini уже является помощником по умолчанию на большинстве устройств под управлением Android, но его ещё нет на планшетах, часах с Wear OS, а также умных колонках и дисплеях Google. Планы компании подтвердил анализ бета-версий некоторых приложений. Так, в приложении Google обнаружились фрагменты кода, указывающие, что Gemini появится на Wear OS в качестве «носимого» помощника — вероятно как обновление существующего приложения «Google Ассистент». Сначала компания обновит лишь приложение, а затем усилит интеграцию с выпуском Wear OS 6.

В недавнем выпуске «Google Ассистента» для Android Automotive обнаружились строки, указывающие, что Google усердно работает над переносом Gemini и на автомобильную платформу. Компания разрабатывает модели ИИ, адаптированные для работы в новых областях с большим потенциалом роста, в том числе для робототехники, добавил господин Пичаи.

ИИ-помощник программиста Google Gemini Code Assist научился писать приложения по описанию и переводить код из одного языка в другой

На конференции Cloud Next представитель компании сообщил, что ИИ-помощник по кодированию Code Assist теперь умеет развёртывать новых ИИ-агентов. Они могут создавать приложения из спецификаций продуктов в Google Docs или выполнять преобразования кода с одного языка на другой. Code Assist теперь доступен в Android Studio в дополнение к другим средам программирования.

 Источник изображения: Google

Источник изображения: Google

Обновления Code Assist являются ответом на конкурентное давление со стороны таких компаний, как GitHub Copilot, Cursor и Cognition Labs, создателя вирусного инструмента программирования Devin. Рынок помощников по кодированию на основе искусственного интеллекта растёт с каждым месяцем, а его ёмкость оценивается в миллиарды долларов.

Агенты Code Assist, которыми можно управлять с новой доски Gemini Code Assist Kanban, могут создавать рабочие планы и отчитываться о пошаговом прогрессе по запросам на работу. Помимо создания программного обеспечения и миграции кода, агенты могут внедрять новые функции приложений, выполнять проверки кода и генерировать модульные тесты и документацию.

Пока трудно понять, насколько хорошо работают агенты Code Assist. Исследования показали, что даже лучшие генераторы кода на основе ИИ на сегодняшний день могут допускать ошибки и вносить уязвимости безопасности из-за неспособности понимать логику программирования. На одном из недавних тестов Devin успешно выполнил только три из двадцати задач.

Поэтому, при использовании любого ИИ-ассистента для программирования не помешает самостоятельно проверить получившийся код.

Мяч с мозгами: Samsung и Google объединились для выпуска домашнего робота Ballie с ИИ Gemini и проектором

Samsung и Google объединились для запуска Ballie, домашнего робота в форме футбольного мяча, который использует ИИ Gemini для управления умным домом и умеет проецировать видео на стены. Жёлтый шарообразный робот призван, по словам Samsung, «оживить ИИ как друга и настоящего компаньона». С этим устройством обе компании впервые выходят на перспективный рынок потребительской робототехники, который оценивается в миллиарды долларов.

 Источник изображений: Samsung

Источник изображений: Samsung

Samsung впервые представила Ballie в начале 2020 года на технологической конференции CES, где он произвёл фурор, но путь к выходу домашнего робота на потребительский рынок оказался тернистым. Исполнительный вице-президент Samsung Джей Ким (Jay Kim) сообщил, что актуальное устройство представляет собой «совершенно новый Ballie». Одним из самых больших изменений стало использование моделей ИИ от Google для понимания команд пользователя, подключения к поиску Google и обработки данных с бортовых камер во время навигации по дому.

 Источник изображений: Samsung

Ballie работает под управлением операционной системы Tizen от Samsung, которая также используется во многих устройствах компании, что обеспечивает ему доступ к таким поставщикам контента, как YouTube, Netflix и собственный сервис Samsung TV Plus. Робот использует платформу Samsung SmartThings для управления умными домашними устройствами, календарями и напоминаниями, ответа на вопросы, совершения и приёма телефонных звонков и воспроизведения видео через встроенный проектор. Он также использует модели ИИ от Samsung для таких функций, как доступ к персональным данным и погоде.

 Источник изображений: Samsung

«Сложно описать систему, которая может чувствовать, двигаться и взаимодействовать так естественно, как это делает она, — считает генеральный директор Google Cloud Томас Куриан (Thomas Kurian). — Когда вы говорите: “Иди сюда”, она действительно размышляет, как туда попасть. Системе требуется много магии за кулисами, чтобы она заработала».

 Источник изображений: Samsung

По словам Кима, Samsung выбрала Google Cloud из-за своей «веры» в возможности Gemini. Эта работа знаменует собой расширение существующих партнёрских отношений по устройствам Android, умным часам и будущей гарнитуре смешанной реальности, которая также появится в конце этого года. Он добавил, что компании уже разрабатывают дополнительные функции для Ballie, включая комплект разработки программного обеспечения для сторонних приложений и видеоконференций.

Куриан подчеркнул, что партнёрство с Samsung требует «много настроек и оптимизации […] и это единственное наше партнёрство с таким персонализированным опытом».

Устройство сначала поступит в продажу в США и Южной Корее и, по крайней мере, на первых порах будет поддерживать общение только на английском и корейском языках.

Google научит ИИ-чат-бота Gemini анализировать видео

Функция загрузки и анализа файлов в Google Gemini скоро получит поддержку видеофайлов. Анализ предварительной версии приложения помог установить, какие форматы видео будут поддерживаться, когда эта возможность станет общедоступной.

 Источник изображения: blog.google

Источник изображения: blog.google

Чат-бот Gemini уже позволяет загружать файлы и задавать о них вопросы. Сейчас это могут быть документы, файлы с программным кодом, простые текстовые файлы, презентации, электронные таблицы и прочие файлы с табличными данными. Сервис можно использовать для анализа веб-страниц и видео YouTube — о них также можно задавать дополнительные вопросы. Выгрузка видеофайлов пока не поддерживается.

В предварительной версии приложения Google 16.13.38 beta журналисты Android Authority обнаружили строки, указывающие, что сервис получит поддержку загрузки видео в форматах 3GP, AVI, FLV, MOV, MP4, MPEG, MPG и WebM. В других фрагментах кода также обнаружились строки, указывающие, что пользователи смогут загружать на анализ несколько видео одновременно — при этом общая продолжительность видео будет ограничиваться, и ограничения эти, вероятно, станут отличаться для пользователей платной и бесплатной версий сервиса.

Наряду с поддержкой видео функция загрузки и анализа данных Gemini также получит поддержку репозиториев GitHub. Это упростит пользователям задачи, связанные с анализом файлов программного кода при помощи чат-бота. В текущей бета-версии приложения эти функции отсутствуют, и Google пока не делала никаких объявлений, связанных с данными возможностями. Но они могут последовать в обозримом будущем.


window-new
Soft
Hard
Тренды 🔥
Microsoft готовит «бету» Gears of War: Reloaded, но никому об этом не сказала — тестовая версия ремастера засветилась в базе данных Steam 2 ч.
Konami показала вступление Metal Gear Solid Delta: Snake Eater с новой версией легендарной песни 3 ч.
SteamOS получила официальную совместимость с Legion Go S и другими консолями на платформе AMD 3 ч.
«Я не я, и лошадь не моя»: главы технокомпаний стали отправлять на встречи с инвесторами своих ИИ-двойников 4 ч.
Intel разрабатывает ИИ-тренера для геймеров — он помогает в прохождении игр 4 ч.
Вьетнам заблокирует Telegram за токсичный контент и отказ сотрудничать с властями 6 ч.
В Discord хотят использовать ИИ для расширения возможностей платформы 6 ч.
Ведомство Илона Маска DOGE принимало решения, пользуясь Meta Llama 2, а не xAI Grok 8 ч.
Сергей Брин передал акции Alphabet на $700 млн неизвестно кому 9 ч.
BioShock скоро выйдет из тени — инсайдер заинтриговал фанатов будущим анонсом от 2K 9 ч.