Опрос
|
реклама
Быстрый переход
Google научила ИИ-бота Gemini редактировать любые изображения
01.05.2025 [14:22],
Дмитрий Федоров
Google Gemini научился редактировать как сгенерированные ИИ изображения, так и загруженные со смартфона или компьютера. В ближайшие недели новая функциональность станет доступна пользователям в большинстве стран мира, где доступен Gemini, и получит поддержку более чем 45 языков. Россия, напомним, в этот список не входит, однако русский язык Gemini понимает и «говорит» на нём. ![]() Источник изображений: Google Нативное редактирование изображений в ИИ-чат-боте Gemini представляет собой эволюционный шаг в развитии возможностей взаимодействия пользователя с ИИ. Запуск последовал за моделью редактирования изображений с помощью ИИ, которую Google опробовала в марте в своей платформе AI Studio и которая получила широкую огласку благодаря своей спорной способности удалять водяные знаки с любого изображения. Подобно недавно обновлённому инструменту редактирования изображений в ChatGPT, встроенный редактор Gemini теоретически способен достигать более высоких результатов по сравнению с автономными ИИ-генераторами изображений. Теперь Gemini предлагает инновационный «многоэтапный» процесс редактирования, обеспечивающий, по описанию компании, «более богатые и контекстуальные» отклики на каждый запрос — с интеграцией текста и изображений. Функциональность нового редактора позволяет пользователям изменять фон на изображениях, заменять объекты, добавлять элементы и выполнять множество других операций — и всё это непосредственно в интерфейсе Gemini. Подобное решение существенно упрощает процесс создания и редактирования визуального контента, устраняя необходимость переключаться между несколькими специализированными приложениями. ![]() «Например, вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос. Также можно попросить Gemini создать первый черновик сказки на ночь о драконах и сгенерировать иллюстрации к истории», — поясняет Google в своём блоге. Эти примеры наглядно демонстрируют многофункциональность системы, пригодной как для утилитарных, так и для креативных задач. Потенциальные риски технологии в контексте создания дипфейков обоснованно вызывают опасения у специалистов по информационной безопасности. Чтобы нивелировать возможные злоупотребления, Google внедряет технологию невидимых водяных знаков во все изображения, созданные или отредактированные с помощью нативного генератора изображений Gemini. Параллельно компания проводит экспериментальные исследования по внедрению видимых водяных знаков на всех изображениях, сгенерированных с помощью Gemini. Google подтвердила, что близка к внедрению ИИ-модели Gemini в iPhone
01.05.2025 [00:53],
Анжелла Марина
Генеральный директор Google Сундар Пичаи (Sundar Pichai) заявил, что компания близка к соглашению с Apple о внедрении модели искусственного интеллекта Gemini в iPhone. Это позволит Siri использовать широкие возможности ИИ-модели для ответов на более сложные вопросы. ![]() Источник изображения: Solen Feyissa / Unsplash Ещё в июне прошлого года старший вице-президент Apple Крейг Федериги (Craig Federighi) намекал на возможность интеграции, говоря, что компания хотела бы, чтобы в будущем у пользователей была возможность выбора между ИИ-моделями, включая Google Gemini. В настоящий момент добавлена только поддержка чат-бота от OpenAI в систему Apple Intelligence, которая перенаправляет сложные запросы в ChatGPT, если они выходят за рамки её возможностей, отмечает The Verge. Пичаи подтвердил, что обсуждал вопрос интеграции с главой Apple Тимом Куком (Tim Cook), а он, в свою очередь, интересовался планами разработки и продвижения Gemini, и также подтвердил, что его компания намерена добавить уже в этом году в Apple Intelligence больше сторонних ИИ-моделей. Если сделка состоится (предположительно к концу 2025 года), Gemini станет второй сторонней ИИ-системой, доступной в экосистеме Apple, и даст пользователям возможность выбора между технологиями OpenAI и Google, а также усилит конкуренцию в области искусственного интеллекта. Google Gemini поможет в практике иностранных языков — есть и поддержка русского
30.04.2025 [17:56],
Павел Котов
Google выпустила три экспериментальных проекта на основе технологий искусственного интеллекта, предназначенные для помощи пользователям в изучении иностранных языков. Разработка решений находится на ранних этапах, но большая языковая модель Gemini уже сейчас становится грозным конкурентом Duolingo. ![]() Источник изображений: googleblog.com Первый экспериментальный проект направлен на быстрое изучение определённых фраз, которые нужны пользователю в данный момент; второй предназначен для того, чтобы сформировать у обучаемого менее формальные навыки иностранного языка и выработать у него манеру общения, более свойственную местным жителям. Третий экспериментальный проект предполагает подключение камеры для формирования нового лексикона на основе окружающих предметов. Один из наиболее неприятных аспектов при изучении иностранного языка, отмечают в Google, — оказаться в ситуации, когда нужна конкретная фраза, но она ещё не изучена. Экспериментальная функция Tiny Lesson позволяет описать ситуацию, например, «поиски утерянного паспорта» и получить рекомендации по словарному запасу и грамматике, адаптированные к контексту, например: «Я не знаю, где его потерял» или «Я хочу сообщить об этом в полицию». Вторая экспериментальная функция получила название Slang Hang, её задача — сделать речь обучающегося менее «учебной», то есть менее формальной, более разговорной и обогащённой местным сленгом. Можно смоделировать реалистичный разговор между носителями языка и по каждой реплике проследить, как разворачивается диалог. Это может быть, например, разговор покупателя с уличным торговцем или сценарий встречи двух давно потерявших друг друга приятелей в метро. В рамках этого экспериментального проекта, признались в Google, ИИ иногда неправильно применяет сленг, поэтому его рекомендации лучше сопоставлять с надёжными источниками. ![]() Третий эксперимент получил название Word Cam: пользователь делает снимок окружающих его предметов, Gemini их распознаёт и предлагает названия на изучаемом языке. Иногда на практике требуется знать, как называются предметы вокруг, и эта функция может продемонстрировать, что пользователь ещё многого не изучил. Например, можно знать слово «окно», но не «жалюзи». Идея этих проектов состоит в том, чтобы обозначить новые варианты использования ИИ, сделать самостоятельное изучение языков более динамичным и личностно ориентированным. Новые экспериментальные функции Google Gemini способны помочь в изучении следующих языков: арабский, китайский (материковый Китай, Гонконг, Тайвань), английский (Австралия, Великобритания, США), французский (Канада, Франция), немецкий, греческий, иврит, хинди, итальянский, японский, корейский, португальский (Бразилия, Португалия), русский, испанский (Латинская Америка, Испания) и турецкий. Доступ к ним открывается через платформу Google Labs. Google готовит Gemini для детей — ИИ будет под контролем родителей
29.04.2025 [18:49],
Павел Котов
Google собирается открыть доступ к помощнику с искусственным интеллектом Gemini для детей до 13 лет, чьи устройства контролируются родителями с помощью приложения Family Link. Компания предупредила, что ИИ может вести себя непредсказуемо. ![]() Источник изображения: blog.google Google сообщила о намерении выпустить детский вариант Gemini — для этой аудитории предлагаются такие варианты использования, как помощь с домашними заданиями, ответы на вопросы и генерация сказок с учётом возраста ребёнка. Дети смогут взаимодействовать с ИИ-помощником в приложениях для Android, iOS, а также в веб-версии Gemini; на Android службу можно будет установить в качестве помощника по умолчанию. Учитывая непредсказуемость современных моделей ИИ, Google предупредила пользователей, что «Gemini может допускать ошибки», и порекомендовала родителям научить детей «относиться к ответам Gemini критически». В компании подчеркнули, что ребёнок должен понимать: Gemini — не человек; он может отвечать, как человек, но не обладает сознанием и эмоциями. Поэтому ребёнку следует проверять получаемую информацию и не доверять ИИ конфиденциальные данные. Родителям также стоит учитывать, что механизмы ограничения контента у ИИ не совершенны, и Gemini потенциально может продемонстрировать нежелательные материалы. В связи с этим контроль над системой будет осуществляться через приложение Family Link. О сроках развёртывания детской версии Gemini Google пообещала сообщить дополнительно. ИИ-помощник Google Gemini появится в автомобилях, умных часах и наушниках
26.04.2025 [10:55],
Павел Котов
В последние пару лет Google активно интегрирует чат-бота Gemini с искусственным интеллектом в свои продукты: в Gmail, Android, «Google Диск» и другие сервисы. К концу года присутствие чат-бота расширится — он появится на платформе Wear OS для умных часов, Android Auto для автомобилей и в беспроводных наушниках. ![]() Источник изображения: blog.google В ходе брифинга после квартального финансового отчёта гендиректор холдинга Alphabet Сундар Пичаи (Sundar Pichai) объявил, что в скором времени Gemini появится на новых устройствах: «Мы обновим Google Assistant на мобильных устройствах до Gemini, а позже в этом году обновим планшеты, автомобили и устройства, которые подключаются к смартфону, такие как наушники и часы». В этом году конференция разработчиков Google I/O запланирована на 20–21 мая — возможно, на ней компания подробнее расскажет о своих планах расширить присутствие Gemini. Google Gemini уже является помощником по умолчанию на большинстве устройств под управлением Android, но его ещё нет на планшетах, часах с Wear OS, а также умных колонках и дисплеях Google. Планы компании подтвердил анализ бета-версий некоторых приложений. Так, в приложении Google обнаружились фрагменты кода, указывающие, что Gemini появится на Wear OS в качестве «носимого» помощника — вероятно как обновление существующего приложения «Google Ассистент». Сначала компания обновит лишь приложение, а затем усилит интеграцию с выпуском Wear OS 6. В недавнем выпуске «Google Ассистента» для Android Automotive обнаружились строки, указывающие, что Google усердно работает над переносом Gemini и на автомобильную платформу. Компания разрабатывает модели ИИ, адаптированные для работы в новых областях с большим потенциалом роста, в том числе для робототехники, добавил господин Пичаи. ИИ-помощник программиста Google Gemini Code Assist научился писать приложения по описанию и переводить код из одного языка в другой
09.04.2025 [18:32],
Сергей Сурабекянц
На конференции Cloud Next представитель компании сообщил, что ИИ-помощник по кодированию Code Assist теперь умеет развёртывать новых ИИ-агентов. Они могут создавать приложения из спецификаций продуктов в Google Docs или выполнять преобразования кода с одного языка на другой. Code Assist теперь доступен в Android Studio в дополнение к другим средам программирования. ![]() Источник изображения: Google Обновления Code Assist являются ответом на конкурентное давление со стороны таких компаний, как GitHub Copilot, Cursor и Cognition Labs, создателя вирусного инструмента программирования Devin. Рынок помощников по кодированию на основе искусственного интеллекта растёт с каждым месяцем, а его ёмкость оценивается в миллиарды долларов. Агенты Code Assist, которыми можно управлять с новой доски Gemini Code Assist Kanban, могут создавать рабочие планы и отчитываться о пошаговом прогрессе по запросам на работу. Помимо создания программного обеспечения и миграции кода, агенты могут внедрять новые функции приложений, выполнять проверки кода и генерировать модульные тесты и документацию. Пока трудно понять, насколько хорошо работают агенты Code Assist. Исследования показали, что даже лучшие генераторы кода на основе ИИ на сегодняшний день могут допускать ошибки и вносить уязвимости безопасности из-за неспособности понимать логику программирования. На одном из недавних тестов Devin успешно выполнил только три из двадцати задач. Поэтому, при использовании любого ИИ-ассистента для программирования не помешает самостоятельно проверить получившийся код. Мяч с мозгами: Samsung и Google объединились для выпуска домашнего робота Ballie с ИИ Gemini и проектором
09.04.2025 [17:58],
Сергей Сурабекянц
Samsung и Google объединились для запуска Ballie, домашнего робота в форме футбольного мяча, который использует ИИ Gemini для управления умным домом и умеет проецировать видео на стены. Жёлтый шарообразный робот призван, по словам Samsung, «оживить ИИ как друга и настоящего компаньона». С этим устройством обе компании впервые выходят на перспективный рынок потребительской робототехники, который оценивается в миллиарды долларов. ![]() Источник изображений: Samsung Samsung впервые представила Ballie в начале 2020 года на технологической конференции CES, где он произвёл фурор, но путь к выходу домашнего робота на потребительский рынок оказался тернистым. Исполнительный вице-президент Samsung Джей Ким (Jay Kim) сообщил, что актуальное устройство представляет собой «совершенно новый Ballie». Одним из самых больших изменений стало использование моделей ИИ от Google для понимания команд пользователя, подключения к поиску Google и обработки данных с бортовых камер во время навигации по дому. ![]() Ballie работает под управлением операционной системы Tizen от Samsung, которая также используется во многих устройствах компании, что обеспечивает ему доступ к таким поставщикам контента, как YouTube, Netflix и собственный сервис Samsung TV Plus. Робот использует платформу Samsung SmartThings для управления умными домашними устройствами, календарями и напоминаниями, ответа на вопросы, совершения и приёма телефонных звонков и воспроизведения видео через встроенный проектор. Он также использует модели ИИ от Samsung для таких функций, как доступ к персональным данным и погоде. ![]() «Сложно описать систему, которая может чувствовать, двигаться и взаимодействовать так естественно, как это делает она, — считает генеральный директор Google Cloud Томас Куриан (Thomas Kurian). — Когда вы говорите: “Иди сюда”, она действительно размышляет, как туда попасть. Системе требуется много магии за кулисами, чтобы она заработала». ![]() По словам Кима, Samsung выбрала Google Cloud из-за своей «веры» в возможности Gemini. Эта работа знаменует собой расширение существующих партнёрских отношений по устройствам Android, умным часам и будущей гарнитуре смешанной реальности, которая также появится в конце этого года. Он добавил, что компании уже разрабатывают дополнительные функции для Ballie, включая комплект разработки программного обеспечения для сторонних приложений и видеоконференций. Куриан подчеркнул, что партнёрство с Samsung требует «много настроек и оптимизации […] и это единственное наше партнёрство с таким персонализированным опытом». Устройство сначала поступит в продажу в США и Южной Корее и, по крайней мере, на первых порах будет поддерживать общение только на английском и корейском языках. Google научит ИИ-чат-бота Gemini анализировать видео
08.04.2025 [16:42],
Павел Котов
Функция загрузки и анализа файлов в Google Gemini скоро получит поддержку видеофайлов. Анализ предварительной версии приложения помог установить, какие форматы видео будут поддерживаться, когда эта возможность станет общедоступной. ![]() Источник изображения: blog.google Чат-бот Gemini уже позволяет загружать файлы и задавать о них вопросы. Сейчас это могут быть документы, файлы с программным кодом, простые текстовые файлы, презентации, электронные таблицы и прочие файлы с табличными данными. Сервис можно использовать для анализа веб-страниц и видео YouTube — о них также можно задавать дополнительные вопросы. Выгрузка видеофайлов пока не поддерживается. В предварительной версии приложения Google 16.13.38 beta журналисты Android Authority обнаружили строки, указывающие, что сервис получит поддержку загрузки видео в форматах 3GP, AVI, FLV, MOV, MP4, MPEG, MPG и WebM. В других фрагментах кода также обнаружились строки, указывающие, что пользователи смогут загружать на анализ несколько видео одновременно — при этом общая продолжительность видео будет ограничиваться, и ограничения эти, вероятно, станут отличаться для пользователей платной и бесплатной версий сервиса. Наряду с поддержкой видео функция загрузки и анализа данных Gemini также получит поддержку репозиториев GitHub. Это упростит пользователям задачи, связанные с анализом файлов программного кода при помощи чат-бота. В текущей бета-версии приложения эти функции отсутствуют, и Google пока не делала никаких объявлений, связанных с данными возможностями. Но они могут последовать в обозримом будущем. Google представила Gemini 2.5 Pro — свою самую умную ИИ-модель, которая превзошла OpenAI o3
25.03.2025 [23:09],
Анжелла Марина
Компания Google анонсировала ИИ-модель Gemini 2.5 Pro, назвав её «своей самой умной моделью» на сегодняшний день. Нейросеть является частью семейства Gemini 2.5 и превосходит предыдущие версии в анализе данных, программировании и решении сложных задач, поддерживая контекст до 1 млн токенов. ![]() Источник изображений: Google Ключевой особенностью Gemini 2.5 Pro, как и всех моделей семейства Gemini 2.5, является способность рассуждать, представляя ход своих мыслей перед тем, как выдать пользователю более точный и окончательный ответ. В отличие от предыдущего поколения моделей (Gemini 2.0 Flash Thinking), Google больше не использует маркировку Thinking и не демонстрирует ход рассуждений. Однако, как уточняет сайт 9to5Google, пользователи могут вручную активировать функцию «размышления вслух», чтобы увидеть ход мысли бота. В целом Gemini 2.5 Pro продемонстрировала значительный скачок в производительности благодаря улучшенной базовой модели и доработкам после обучения. Google отмечает, что эта версия возглавила рейтинг LMArena, который оценивает модели на основе пользовательских предпочтений, а также показала лучшие результаты в математике (AIME 2025) и науке (GPQA diamond). ![]() Одновременно в тесте Humanity’s Last Exam («Последний экзамен человечества»), который создан экспертами для проверки предела возможностей искусственного интеллекта в области знаний и логики, Gemini 2.5 Pro достигла рекордных 18,8 % без использования дополнительных инструментов. Также модель получила существенные улучшения в программировании, особенно в создании веб-приложений и редактировании кода. ![]() В области разработки программного обеспечения Gemini 2.5 Pro продемонстрировала высокий результат на тесте SWE-Bench Verified, набрав 63,8 % при использовании специального агентского подхода. Кроме того, модель обладает встроенной мультимодальностью и способна работать с текстом, аудио, изображениями, видео, обрабатывать большие наборы данных и даже репозитории кода в полном объёме. Контекстное окно модели предлагает размер в 1 миллион токенов, а в ближайшем будущем оно увеличится до 2 миллионов. В следующие несколько недель Gemini 2.5 Pro появится в Vertex AI, а позднее Google представит ценовую политику, позволяющую использовать ИИ-модель в масштабных проектах. Пока модель доступна для платных подписчиков и разработчиков в тестовом режиме. ИИ Gemini научился консультировать людей о местах из «Google Карт»
25.03.2025 [13:29],
Павел Котов
Большая языковая модель искусственного интеллекта Gemini порой предлагает впечатляющие возможности, но люди смогут оценить их, только когда испытают сами. Google стремится интегрировать её в большинство своих сервисов, включая картографический, где ИИ становится источником справочной информации. ![]() Источник изображения: androidauthority.com В сервисе «Google Карты» началось широкомасштабное развёртывание новой функции — кнопки «Задать вопрос о месте» (Ask about place), обратил внимание ресурс Android Authority. Функция появляется постепенно — она отмечается не у всех, а набор её возможностей пока варьируется от одного пользователя к другому. Открывая отдельные местоположения в «Google Картах», можно задавать Gemini связанные с этими местами вопросы, например, как лучше добраться до пункта назначения. Механизм работы функции относительно прост — запрос к ИИ сопровождается URL-адресом из картографического сервиса. Кнопка, когда она доступна, появляется для большинства локаций, но зависит от их масштаба. К примеру, она отсутствует при просмотре города или региона целиком. Иногда Gemini отвечает, что не может работать с картами, в отдельных случаях для обработки запросов требуется платная подписка Gemini Advanced. Вероятно, Google начала развёртывать функцию для широкого круга пользователей, не доработав её до конца и не сделав соответствующих заявлений, и в перспективе компания всё-таки наладит адекватный механизм её работы. Исследователи нашли способ масштабирования ИИ без дополнительного обучения, но это не точно
19.03.2025 [23:34],
Анжелла Марина
Группа исследователей из Google и Калифорнийского университета в Беркли предложила новый метод масштабирования искусственного интеллекта (ИИ). Речь идёт о так называемом «поиске во время вывода», который позволяет модели генерировать множество ответов на запрос и выбирать лучший из них. Этот подход может повысить производительность моделей без дополнительного обучения. Однако сторонние эксперты усомнились в правильности идеи. ![]() Источник изображения: сгенерировано AI Ранее основным способом улучшения ИИ было обучение больших языковых моделей (LLM) на всё большем объёме данных и увеличение вычислительных мощностей при запуске (тестировании) модели. Это стало нормой, а точнее сказать, законом для большинства ведущих ИИ-лабораторий. Новый метод, предложенный исследователями, заключается в том, что модель генерирует множество возможных ответов на запрос пользователя и затем выбирает лучший. Как отмечает TechCrunch, это позволит значительно повысить точность ответов даже у не очень крупных и устаревших моделей. В качестве примера учёные привели модель Gemini 1.5 Pro, выпущенную компанией Google в начале 2024 года. Утверждается, что, используя технику «поиска во время вывода» (inference-time search), эта модель обошла мощную o1-preview от OpenAI по математическим и научным тестам. Один из авторов работы, Эрик Чжао (Eric Zhao), подчеркнул: «Просто случайно выбирая 200 ответов и проверяя их, Gemini 1.5 однозначно обходит o1-preview и даже приближается к o1». Тем не менее, эксперты посчитали эти результаты предсказуемыми и не увидели в методе революционного прорыва. Мэтью Гуздиал (Matthew Guzdial), исследователь ИИ из Университета Альберты, отметил, что метод работает только в тех случаях, когда можно чётко определить правильный ответ, а в большинстве задач это невозможно. С ним согласен и Майк Кук (Mike Cook), исследователь из Королевского колледжа Лондона. По его словам, новый метод не улучшает способность ИИ к рассуждениям, а лишь помогает обходить существующие ограничения. Он пояснил: «Если модель ошибается в 5 % случаев, то, проверяя 200 вариантов, эти ошибки просто станут более заметны». Основная проблема состоит в том, что метод не делает модели умнее, а просто увеличивает количество вычислений для поиска наилучшего ответа. В реальных условиях такой подход может оказаться слишком затратным и малоэффективным. Несмотря на это, поиск новых способов масштабирования ИИ продолжается, поскольку современные модели требуют огромных вычислительных ресурсов, а исследователи стремятся найти методы, которые позволят повысить уровень рассуждений ИИ без чрезмерных затрат. Google DeepMind дала роботам ИИ, с которым они могут выполнять сложные задания без предварительного обучения
12.03.2025 [20:41],
Сергей Сурабекянц
Лаборатория Google DeepMind представила две новые модели ИИ, которые помогут роботам «выполнять более широкий спектр реальных задач, чем когда-либо прежде». Gemini Robotics — это модель «зрение-язык-действие», способная понимать новые ситуации без предварительного обучения. А Gemini Robotics-ER компания описывает как передовую модель, которая может «понимать наш сложный и динамичный мир» и управлять движениями робота. ![]() Источник изображений: Google DeepMind Модель Gemini Robotics построена на основе Gemini 2.0, последней версии флагманской модели ИИ от Google. ПО словам руководителя отдела робототехники Google DeepMind Каролины Парада (Carolina Parada), Gemini Robotics «использует мультимодальное понимание мира Gemini и переносит его в реальный мир, добавляя физические действия в качестве новой модальности». Новая модель особенно сильна в трёх ключевых областях, которые, по словам Google DeepMind, необходимы для создания по-настоящему полезных роботов: универсальность, интерактивность и ловкость. Помимо способности обобщать новые сценарии, Gemini Robotics лучше взаимодействует с людьми и их окружением. Модель способна выполнять очень точные физические задачи, такие как складывание листа бумаги или открывание бутылки. ![]() «Хотя в прошлом мы уже достигли прогресса в каждой из этих областей по отдельности, теперь мы приносим [резко] увеличивающуюся производительность во всех трёх областях с помощью одной модели, — заявила Парада. — Это позволяет нам создавать роботов, которые более способны, более отзывчивы и более устойчивы к изменениям в окружающей обстановке». Модель Gemini Robotics-ER разработана специально для робототехников. С её помощью специалисты могут подключаться к существующим контроллерам низкого уровня, управляющим движениями робота. Как объяснила Парада на примере упаковки ланч-бокса — на столе лежат предметы, нужно определить, где что находится, как открыть ланч-бокс, как брать предметы и куда их класть. Именно такой цепочки рассуждений придерживается Gemini Robotics-ER. ![]() Разработчики уделили серьёзное внимание безопасности. Исследователь Google DeepMind Викас Синдхвани (Vikas Sindhwani) рассказал, как лаборатория использует «многоуровневый подход», при котором модели Gemini Robotics-ER «обучаются оценивать, безопасно ли выполнять потенциальное действие в заданном сценарии». Кроме того, Google DeepMind разработала ряд эталонных тестов и фреймворков, чтобы помочь дальнейшим исследованиям безопасности в отрасли ИИ. В частности, в прошлом году лаборатория представила «Конституцию робота» — набор правил, вдохновлённых «Тремя законами робототехники», сформулированными Айзеком Азимовым в рассказе «Хоровод» в 1942 году. В настоящее время Google DeepMind совместно с компанией Apptronik разрабатывает «следующее поколение человекоподобных роботов». Также лаборатория предоставила доступ к своей модели Gemini Robotics-ER «доверенным тестировщикам», среди которых Agile Robots, Agility Robotics, Boston Dynamics и Enchanted Tools. «Мы полностью сосредоточены на создании интеллекта, который сможет понимать физический мир и действовать в этом физическом мире, — сказала Парада. — Мы очень рады использовать это в нескольких воплощениях и во многих приложениях для нас». ![]() Напомним, что в сентябре 2024 года исследователи из Google DeepMind продемонстрировали метод обучения, позволяющий научить робота выполнять некоторые требующие определённой ловкости действия, такие как завязывание шнурков, подвешивание рубашек и даже починка других роботов. Google анонсировала видеочат с Gemini: ИИ-помощник сможет понять, что происходит вокруг пользователя
03.03.2025 [17:41],
Павел Котов
Google представила на выставке MWC 2025 дуэт функций Project Astra: уже в марте пользователи помощника с искусственным интеллектом Gemini получат возможность демонстрировать ему экран смартфона или транслировать видео с камеры. ![]() Источник изображений: youtube.com/@Google В интерфейсе Gemini на Android, позволяющем выводить элементы управления поверх других приложений, появится новая кнопка «Поделиться экраном с Live» (Share screen with Live) над текстовым полем «Спросить Gemini» (Ask Gemini). Открыв ИИ-помощнику изображение экрана, пользователь попадает в интерфейс телефонного звонка и начинает диалог с Gemini. Можно задавать ИИ вопросы о том, что изображено на экране, и вести полноценный разговор. ![]() В полноэкранном формате Gemini Live можно выбрать также кнопку трансляции видео, расположенную рядом с кнопкой запуска демонстрации экрана, — видео транслируется почти на весь дисплей. Google немного уменьшила размеры кнопок Gemini Live — из круглых они стали вытянутыми по горизонтали и более компактными. Об этих функциях компания рассказала в мае минувшего года на конференции Google I/O 2024, более подробно остановилась на них в декабре на презентации Gemini 2.0, некоторые возможности также демонстрировались в январе на презентации смартфонов Samsung Galaxy S25. Первыми воспользоваться функциями Gemini Live уже в марте смогут владельцы Android-устройств и подписки Gemini Advanced. ИИ Gemini пропал из приложения Google для iOS
19.02.2025 [17:01],
Дмитрий Федоров
Компания Google завершила процесс переноса ИИ Gemini в отдельное приложение для iOS и официально отключила поддержку ассистента в основном приложении Google для iPhone. Теперь для работы с ИИ необходимо установить приложение Gemini из Apple App Store, которое обеспечивает доступ ко всем функциям ИИ, включая поддержку Gemini Live и генерацию изображений с помощью Imagen 3. ![]() Источник изображений: Google Ещё в ноябре 2024 года компания представила самостоятельное приложение Gemini для iOS. Несмотря на это, до настоящего момента пользователи могли продолжать работать с Gemini через приложение Google. После отключения поддержки Gemini в приложении Google при попытке воспользоваться сервисом пользователи видят сообщение, призывающее установить основную программу. Самостоятельное приложение Gemini для iOS предлагает весь спектр знакомых функций, а также ряд новых возможностей. Важным нововведением стала поддержка генератора изображений с искусственным интеллектом Imagen 3, позволяющего пользователям создавать изображения высокого качества за считанные секунды. Кроме того, голосовой помощник Gemini Live теперь доступен на нескольких языках, что расширяет его возможности общения с человеком. ![]() Последнее обновление Gemini для iOS — версия 1.2025.0570102 — добавило расширенные функции интеграции с сервисами Google. Теперь пользователи могут, не выходя из приложения, прокладывать маршруты в Google Maps, просматривать рекомендованные видео в YouTube и работать с письмами в Gmail. Такой подход делает ИИ более универсальным инструментом, глубже интегрированным в экосистему Google. Отказ от поддержки Gemini в приложении Google для iOS обусловлен стремлением компании централизовать доступ к своему ИИ-ассистенту. Разделение функциональности позволяет Google гибко развивать продукт, оперативно выпускать обновления и внедрять новые технологии без ограничений, связанных с интеграцией в сторонние сервисы. Кроме того, отдельное приложение открывает перспективы монетизации ИИ, включая возможное введение подписочных моделей для расширенной функциональности. Этот шаг Google следует рассматривать в контексте растущей конкуренции на рынке ИИ. Компания активно развивает свои технологии, соперничая с Apple, Microsoft и OpenAI. Перенос Gemini в отдельное приложение может упростить дальнейшие обновления, ускорить внедрение новых функций и повысить конкурентоспособность продукта, особенно в сравнении с ChatGPT компании OpenAI и возможными будущими ИИ-решениями Apple для Siri. Google обновила Gemini: ИИ-помощник начал запоминать прошлые разговоры
14.02.2025 [05:13],
Дмитрий Федоров
Google представила новую функцию для своего ИИ-помощника Gemini, которая позволяет запоминать предыдущие беседы и использовать этот контекст в ответах. Обновление доступно подписчикам Google One AI Premium и даёт им возможность продолжать диалог c ИИ без необходимости напоминания деталей. Новая функция уже работает в веб-версии и мобильном приложении Gemini на английском языке, а поддержка других языков и интеграция с Google Workspace ожидаются в ближайшие недели. ![]() Источник изображения: Google Помимо запоминания контекста, новая функция позволяет пользователям запрашивать краткие итоги предыдущих бесед, что упрощает работу с информацией и делает Gemini более удобным инструментом для долгосрочных задач, требующих последовательного анализа данных. Например, пользователи могут отслеживать изменения в своих запросах или быстро восстанавливать в памяти обсуждённые ранее идеи. Ранее Google внедрила механизм запоминания пользовательских предпочтений, однако теперь ИИ-помощник способен учитывать не только разрозненные параметры, но и целостную структуру диалогов, что позволяет строить работу на основе накопленного контекста. Пользователи могут управлять историей взаимодействий с Gemini в любое время. Для этого достаточно открыть профиль в приложении, перейти в раздел «Gemini Apps Activity» и выбрать нужные параметры: просмотр, удаление или полную очистку сохранённых данных. Такой подход позволяет гибко контролировать, какие аспекты общения с ИИ остаются в памяти чат-бота, а какие подлежат удалению. Это не только повышает уровень персонализации, но и даёт возможность регулировать степень конфиденциальности данных. Функция запоминания уже доступна подписчикам Google One AI Premium, однако пока только на английском языке. В ближайшие недели Google планирует расширить её поддержку, добавив новые языки, а также интегрировать этот механизм в корпоративные тарифные планы Google Workspace Business и Enterprise. Хотя точные сроки запуска функции на других языках не называются, очевидно, что компания стремится сделать своего ИИ-помощника более универсальным и полезным для широкой аудитории. Подобные технологии уже применяются в других ИИ-чат-ботах, включая ChatGPT, который также способен запоминать детали прошлых разговоров и учитывать предпочтения пользователей. Однако подход Google сосредоточен на глубокой интеграции с экосистемой её сервисов, таких как Google Workspace. Это может дать дополнительные преимущества корпоративным клиентам, которым важны непрерывность рабочих процессов и возможность использования ИИ в структурированных деловых задачах. Конкуренция на рынке ИИ-ассистентов усиливается, и благодаря этому обновлению Gemini становится ещё более гибким инструментом для работы с накопленной информацией. |