Сегодня 10 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gemini
Быстрый переход

Нейросеть Google Veo 3 научилась создавать вертикальные видео для соцсетей

Генеративная модель для создания видео Google Veo 3 получила поддержку вертикального формата 9:16 и разрешение 1080 пикселей. Теперь разработчики смогут создавать контент, который идеально подходит по формату для TikTok и YouTube Shorts, причём по значительно меньшей цене. Об этом компания сообщила в официальном блоге для разработчиков.

 Источник изображения: Google

Источник изображения: Google

Согласно сообщению, основная версия Veo 3 и её более бюджетная модификация Veo 3 Fast теперь позволяют создавать ролики в оптимальном формате для мобильных устройств и социальных платформ. Активировать вертикальный формат можно, установив параметр aspectRatio в запросах API на значение 9:16. Кроме того, обновление позволяет устанавливать более высокое разрешение по сравнению с предыдущим ограничением в 720 пикселей. Однако, как сообщает The Verge, поддержка разрешения 1080 пикселей в настоящее время доступна только для видео с соотношением сторон 16:9.

В Google также заявили, что Veo 3 и Veo 3 Fast теперь «стабильны и готовы к масштабируемому использованию в Gemini API», при этом стоимость использования сервиса существенно изменилась: генерации одной секунды видео через Veo 3 снизилась с $0,75 до $0,40, а через Veo 3 Fast — с $0,40 до $0,15 за секунду.

Отмечается, что добавление поддержки вертикального видео не стало большой неожиданностью, поскольку компания ещё в июне анонсировала интеграцию Veo 3 с YouTube Shorts, которая была запланирована на конец лета. Очевидно, что в ближайшее время пользователи TikTok и Instagram Reels больше увидят в своих лентах контент, созданный помощью нейросети Google Veo 3.

Google добавила в Gemini поддержку аудиофайлов для всех платформ, включая iOS

Google добавила в приложение Gemini возможность загрузки аудиофайлов на всех платформах: Android, iOS и в веб-версии. Теперь можно загружать аудиозаписи в форматах MP3, M4A, WAV и других через меню «Файлы» на мобильных устройствах или через пункт «Загрузить файлы» в браузерной версии.

 Источник изображения: 9to5google.com

Источник изображений: 9to5google.com

Подписчики Google AI Pro или Google AI Ultra могут загружать аудио общей длительностью до трёх часов, тогда как бесплатные пользователи имеют ограничение в 10 минут, сообщается на сайте поддержки компании. Новая функция особенно полезна для транскрибирования аудиоматериалов и реализована в ответ на многочисленные запросы пользователей, так как процесс преобразования устной речи из аудио- или видеофайла в письменный текст оказался одним из самых востребованных.

Ранее аналогичная поддержка уже была добавлена для видео — до 5 минут для бесплатных аккаунтов и до одного часа для платных, при максимальном размере файла 2 Гбайт, все остальные поддерживаемые типы файлов ограничены размером в 100 Мбайт.

Дополнительно в чат Gemini можно добавить одну папку с кодом или один репозиторий GitHub, содержащий до 5000 файлов и не превышающий 100 Мбайт, уточняет 9to5Google. ZIP-архивы могут включать до 10 файлов. В общей сложности за одну сессию допускается загрузка до 10 файлов любого формата.

Google уточнила лимиты для бесплатного и платных тарифов Gemini

До недавнего времени было неясно, какие ограничения Google установила на использование своей ИИ-модели Gemini подписчиками Google AI. Теперь же компания обновила информацию в справочном центре, где появились новые данные в разделе «Ограничения и обновления приложений Gemini для подписчиков Google AI».

 Источник изображения: Google

Источник изображения: Google

Из описания продукта исчезли такие формулировки, как «ограниченный доступ» и другие расплывчатые уточнения, такие как «время от времени мы можем ограничивать количество запросов и диалогов, которые вы можете вести, или интенсивность использования некоторых функций в течение определённого периода времени». Вместо этого теперь чётко указано, что пользователи бесплатных аккаунтов будут иметь возможность делать до пяти запросов в день к ИИ-модели Gemini 2.5 Pro. В это же время подписчики Google AI Pro смогут делать 100 запросов, а на тарифе Google AI Ultra — 500 запросов.

Пользователи бесплатных аккаунтов не могут использовать функцию углубленного исследования Deep Research более 5 раз в день, а также генерировать более 100 изображений за этот же период. Обладатели аккаунтов Google AI Pro и Google AI Ultra имеют возможность генерировать до 1000 изображений ежедневно. Более детально ознакомиться со всеми ограничениями можно на сайте Google.

TCL представила первые в мире телевизоры с Google TV и ИИ-помощником Gemini

ИИ-помощник Gemini для устройств Google TV был впервые анонсирован на выставке CES 2025. Он придёт на смену Google Assistant и будет предлагать рекомендации контента, основанные на запросах пользователя на естественном языке. На выставке Android Show в мае Google объявила, что Gemini для Google TV появится на телевизорах TCL в конце года. А на проходящей сейчас выставке IFA 2025 компания представила первую серию телевизоров с Gemini — TCL QM9K.

 Источник изображений: TCL

Источник изображений: TCL

В серию входят модели с диагональю экрана 65, 75, 85 и 98 дюймов. Все поддерживают разрешение 4K (3840 × 2160 пикселей), частоту обновления 144 Гц и оснащены антибликовым покрытием экранов. Телевизоры TCL QM9K, как и ранее выпущенная модель QM8K, входят общую серию TCL Ultimate. Телевизоры оснащаются панелями CrystGlow WHVA со сверхширокими углами обзора.

TCL QM9K поддерживают функцию Ambient Display в Google TV, которая позволяет им «просыпаться» при появлении человека, показывать красивые заставки и отвечать на голосовые запросы. Для этого предусмотрен коротковолновый (mmWave) датчик присутствия, позволяющий телевизору включаться при обнаружении присутствия человека в комнате. Пользователи могут установить пороговое значение расстояния для помещений с открытой планировкой и даже изменить время отключения телевизора при отсутствии человека в помещении.

TCL QM9K получили микрофоны дальнего радиуса действия, поэтому с Gemini можно общаться, не вставая с дивана. Пользователю доступны такие функции, как разговорный поиск (имитирует человеческое общение), голосовое управление домом и даже создание регулярных задач или сценариев умного дома. Можно задавать даже достаточно сложные вопросы, например, спросить, какой романтический фильм продолжительностью менее двух часов можно посмотреть.

Телевизоры QM9K поддерживают функции генеративного ИИ. Для них можно создавать собственные заставки. Кроме того, здесь есть функция сводки новостей — ИИ может читать их вслух. Gemini на этих моделях телевизоров будет реагировать на активный профиль Google TV. Это означает, что при переключении профилей на телевизорах с Gemini вы в идеале получите другой, персонализированный опыт использования ИИ-инструментов.

Также телевизоры оснащены технологией управления подсветки TCL Halo, которая включает в себя функцию Micro OD, уменьшающую оптическое расстояние между подсветкой и рассеивателем, что помогает уменьшить размытие изображения. Модели QM9K могут похвастаться пиковой яркостью до HDR6500. У тех же QM8K этот показатель составляет HDR5000. Также QM9K имеет до 6000 зон точного локального затемнения, у QM8K их 3800.

Телевизоры QM9K и QM8K оснащены процессорами TCL AiPQ Pro и поддерживают такие HDR-форматы как Dolby Vision IQ, HDR10, HDR10+ и HLG. Встроенная аудиосистема Bang & Olufsen поддерживает технологии Dolby Atmos, Dolby Digital, Dolby Digital+ и DTS:X. Телевизоры предлагают стандартный набор портов: один кабельный вход, порт Ethernet, один USB 3.0, один USB 2.0, цифровой оптический аудиопорт SPDIF, три стандартных порта HDMI и один порт HDMI eARC. Кроме того, они поддерживают Wi-Fi 6.

По словам TCL, модели QM8K в перспективе тоже получат поддержку функций Gemini, но компания не уточнила, когда именно. Новая серия телевизоров TCL QM9K поступит в продажу в конце этого месяца в Best Buy (США) и некоторых региональных розничных магазинах. TCL не раскрыла информацию о ценах на телевизоры. Также неизвестно, когда Gemini появится на других устройствах Google TV, например, на ТВ-приставке Google TV Streamer.

Google выпустила «ИИ-фотошоп» — в Gemini встроили модель nano-banana, которая может точно редактировать картинки

Google обновила чат-бот Gemini, добавив в него основанную на алгоритмах искусственного интеллекта функцию для обработки изображений — она позволяет с высокой точностью контролировать процесс редактирования фотографий. Поисковый гигант стремится выйти на уровень средств обработки изображений от OpenAI и привлечь аудиторию ChatGPT.

 Источник изображения: blog.google

Источник изображения: blog.google

Обновление Gemini 2.5 Flash Image доступно всем пользователям приложения Gemini, а также разработчикам на платформах Gemini API, Google AI Studio и Vertex AI. Новый редактор обрабатывает изображения с высокой точностью на основе запросов простым естественным языком. Он сохраняет единообразие лиц, животных и другие детали, что не всегда под силу конкурирующим инструментам: например, если попросить ChatGPT или xAI Grok изменить на фотографии цвет чьей-то рубашки, на выходе можно получить искажённое лицо или изменения на фоне. Google Gemini 2.5 Flash Image уже завоевала признание пользователей — компания открыла доступ к ней на платформе LMArena под названием «nano-banana».

Слева — оригинальное фото, справа — отредактированное с помощью nano-banana

Это не отдельная модель ИИ, а встроенная функциональность существующей Gemini 2.5 Flash AI. «Мы по-настоящему повысили качество работы с изображением, а также способность модели следовать инструкциям. Это обновление значительно улучшает процесс редактирования, делая его более органичным, а результаты работы модели — пригодными для любых целей», — рассказала ресурсу TechCrunch руководитель направления по генеративным визуальным моделям в Google DeepMind Николь Брихтова (Nicole Brichtova).

Модель обладает глубокими знаниями о мире и позволяет задавать в запросе несколько образцов — например, изображение дивана, гостиной и цветовой палитры можно совместить в едином ответе. «Мы хотим дать пользователям свободу творчества, чтобы они могли получить от моделей то, что хотят. Но это не похоже на что-то другое», — добавила госпожа Брихтова. Google приняла некоторые меры для борьбы с ростом числа дипфейков: на сгенерированные ИИ изображения добавляются визуальные водяные знаки и идентификаторы в метаданных.

Google открыла бесплатный доступ к генератору видео Veo 3, но только на эти выходные

В эти выходные чат-бот на основе искусственного интеллекта Google Gemini предоставит пользователям бесплатного приложения возможность опробовать версию новейшей модели генерации видео Google Veo 3, анонсированной в мае. С её помощью можно создавать на основе запросов 8-секундные клипы со звуком. Отметим для россиян, что эта услуга доступна только с зарубежного IP-адреса.

 Источник изображения: 9to5google

Источник изображения: 9to5google

С июля платные подписчики Google AI Pro по всему миру могут создавать три видео в день с помощью более дешёвой, чем Veo 3, модели Veo 3 Fast, которая генерирует видео в два раза быстрее с разрешением 720p. При этом владельцы подписки Google AI Ultra имеют расширенный доступ к полной версии. Им также доступна функция преобразования фото в видео.

Однако в рамках акции с текущего момента до 22:00 по тихоокеанскому времени воскресенья (понедельник, 9:00 мск) пользователи бесплатной версии Gemini смогут создать три видео с помощью модели Veo 3 Fast. Глава ИИ-сервиса Gemini Джош Вудворд (Josh Woodward) сообщил в четверг в соцсети X, что Google «настраивает массу TPU» перед пробным периодом, чтобы справиться с ожидаемым ростом запросов.

При открытии приложения Gemini можно увидеть сообщение об акции. Если его нет, необходимо нажать на указатель с тремя точками на панели подсказок, чтобы открыть новый элемент «Видео: Генерация с Veo». Запрос пользователя должен «описывать сцену с добавленными деталями, такими как визуальный стиль и фоновая музыка». Можно также указать в описании диалоги и фоновый шум. Создание займёт несколько минут, после чего пользователи смогут скачать клип с водяным знаком (значок Veo в правом нижнем углу) или получить ссылку для общего доступа.

Apple может положить в основу обновлённой Siri модель Google Gemini

Не секрет, что собственные усилия Apple по разработке систем искусственного интеллекта не дают желаемых результатов, а потому она вынуждена полагаться на помощь партнёров. Одним из них может стать Google, чья языковая модель Gemini в модифицированном виде ляжет в основу обновлённого голосового ассистента Siri.

 Источник изображения: Google

По крайней мере, о проведении между Apple и Google переговоров на эту тему накануне сообщило агентство Bloomberg, не став традиционно дожидаться вечера воскресенья для подобных публикаций. Впрочем, пока переговоры находятся в ранней стадии, поскольку выпустить обновлённый вариант Siri компания рассчитывает только в следующем году. Если этот сценарий будет задействован, то Google поможет Apple создать адаптированную языковую модель для обновлённой Siri. Первая из компаний якобы даже начала заниматься обучением этой модели, которая в дальнейшем смогла бы работать на серверной инфраструктуре Apple.

Ранее последняя изучала возможность сотрудничества с Anthropic или OpenAI примерно в том же ключе, поскольку не очень надеялась на собственные силы в модернизации голосового ассистента Siri. При этом точка принятия решения пока не достигнута, и теоретически Apple всё ещё может отдать предпочтение продолжению собственных разработок в этой сфере, как поясняет Bloomberg. Нет пока определённости и с выбором внешнего партнёра. Неудачи при создании собственной инфраструктуры для Siri заставили Apple отказаться от анонса прежнего варианта голосового ассистента весной этого года и перенести его примерно на год. За этим последовали кадровые перестановки в Apple на самом высоком уровне.

На данном этапе, как отмечается, Apple намерена определить, какой из вариантов Siri проявит себя лучше. Базирующийся на собственных разработках получил условное обозначение Linwood, а опирающийся на внешние модели Glenwood готов составить ему конкуренцию. Попытки Apple договориться с Anthropic завершились неудачей из-за разногласий в финансовой сфере, да и собственные разработки первая забрасывать окончательно оказалась не готова. Правда, их дальнейший прогресс отчасти подрывается переходом ценных специалистов из Apple к конкурентам. Собственные языковые модели Apple пока уступают решениям соперников, и компания предпочитает использовать их преимущественно для исследовательских целей и экспериментов.

Подобные переговоры ведутся отдельно от направления интеграции чат-ботов сторонних компаний в комплекс Apple Intelligence. В этой сфере у Apple уже имеется опыт взаимодействия с OpenAI и Google. Последняя уже добилась успехов на данном направлении в переговорах с Samsung Electronics, наделив смартфоны этой марки соответствующей ИИ-функциональностью. В любом случае, Apple сотрудничает с Google в сфере интеграции поисковых систем. Формально, Apple даже рассматривает идею перехода к использованию сторонних моделей в тех ИИ-приложениях, которые не связаны с Siri.

Утечка раскрыла подробности о первой смарт-колонке Google с ИИ-помощником Gemini

На этой неделе Google анонсировала множество новых устройств. В середине мероприятия многие обратили внимание на появление в кадре смарт-динамика с ИИ-помощником Gemini, который так и не был представлен официально. Теперь же в Сети появилась информация о том, что это устройство выйдет на рынок, будет доступно в разных цветовых вариантах, а также получит поддержку сопряжения с Google TV.

 Источник изображения: androidheadlines.com

Источник изображения: androidheadlines.com

В сообщении сказано, что новый смарт-динамик Google будет доступен в чёрном, белом, ярко-красном и светло-зелёном цветовых вариантах исполнения корпуса. Судя по опубликованному видео, устройство имеет подсветку нижнего основания, тогда как до этого Google выпускала смарт-колонки с подсветкой верхней части корпуса.

Что касается доступных функций, то важным нововведением является поддержка сопряжения с Google TV для передачи пространственного звука. Ожидается, что устройство также сможет подключаться к телевизорам на базе операционной системы Google TV. Вероятно, новинка получит поддержку функции естественного озвучивания, распознавания звуков, а также поддержку протокола умного дома Matter.

Динамик дополнит ИИ-помощник Gemini, а не Google Assistant, что не удивительно. На этой неделе Google анонсировала приложение Gemini, которое в октябре появится на уже выпущенных смарт-динамиках и дисплеях Nest. Приложение предложит вариант использования по платной подписке и поддержку Gemini Live, хотя пока неизвестно, какие функции откроет премиальная подписка.

Источник называет устройство «Домашним динамиком», но неизвестно, является ли это официальным названием устройства. Также нет информации о том, когда новый смарт-динамик Google может быть представлен официально.

Google заявила, что её ИИ тратит всего пять капель воды на запрос — эксперты нашли несостыковки

На фоне ожесточённых споров о влиянии искусственного интеллекта на окружающую среду Google провела собственное исследование. В нём говорится, что, благодаря повышению эффективности, ИИ-помощник Gemini использует минимальное количество воды и энергии для каждого запроса. Однако эксперты уверены, что подобные заявления технологического гиганта сознательно вводят общественность в заблуждение.

 Источник изображения: Pixabay

Источник изображения: Pixabay

По оценкам Google, для ответа на средний текстовый запрос Gemini требуется около 0,26 миллилитра воды (пять капель) и примерно 0,24 Вт⋅ч электроэнергии (девять секунд работы телевизора). Это, по словам компании, приводит к выбросам около 0,03 грамма углекислого газа. В отчёте также отмечено, что в этом году Google начала исключать из своих климатических целей определённые категории выбросов парниковых газов, которые, по её словам, являются «периферийными» или находятся вне прямого контроля компании.

Предоставленные Google данные оказались заметно ниже, чем в предыдущих подобных независимых исследованиях. Отчасти это можно объяснить повышением эффективности, однако, по мнению экспертов, Google упустила из виду ключевые данные, что дало неполную картину воздействия Gemini на окружающую среду.

 Источник изображения: Techspot

Источник изображения: Techspot

«Они просто скрывают важную информацию, — утверждает доцент Калифорнийского университета Шаолэй Рен (Shaolei Ren). — Это действительно распространяет неверный сигнал по всему миру». Он занимается изучением потребления воды и загрязнения воздуха, связанных с ИИ, и является одним из авторов статьи, упомянутой Google в своём исследовании Gemini.

Эксперты указали, что Google не учитывает косвенное использование воды в своих оценках. В исследовании учитывалась лишь та вода, которую ЦОД используют в своих системах охлаждения. Но фактически, большая часть воды, потребляемой ЦОД, приходится на электроэнергию, для выработки которой также требуются гигантские объёмы воды, что Google упускает из виду в данном исследовании. «Вы видите, по сути, лишь верхушку айсберга», — прокомментировал отчёт Google аспирант Института экологических исследований Амстердамского свободного университета Алекс де Врис-Гао (Alex de Vries-Gao).

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Google утверждает, что указанный в её отчёте показатель расхода воды в 0,26 мл на средний запрос «на порядки меньше предыдущих оценок», которые в исследовании Рена достигали 50 мл. По мнению Рена, это сравнение вводит в заблуждение, так как он в своём исследовании учитывал как прямое, так и косвенное потребление воды ЦОД.

Google не учитывает ещё один важный показатель, связанный с энергопотреблением и загрязнением окружающей среды. В отчёте компании представлен только «рыночный» показатель выбросов углерода, учитывающий обязательства компании по поддержке роста использования возобновляемых источников энергии в энергосетях. Более комплексный подход должен учитывать местоположение ЦОД и текущее соотношение чистой и грязной энергии в местной энергосети. Эксперты считают, что Google следовало использовать именно такой подход, следуя стандартам, установленным международным «Протоколом по парниковым газам».

Google ссылается на предыдущее исследование, проведённое Реном и де Врис-Гао. Однако учёные утверждают, что Google сравнивает результаты, «как яблоки с апельсинами». Дело в том, что их предыдущие работы основывались на средних значениях, а Google использует медианные показатели, чтобы, как утверждает компания, «исключить искажение результатов выбросами, потребляющими чрезмерно много энергии». Компания также не сообщила количество слов или токенов для текстовых запросов, которые учитывались в отчёте.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Google ещё не представила свою новую работу на рецензирование, хотя представитель компании заявил, что компания планирует сделать это в будущем. По словам Google, компания стремится к большей прозрачности в отношении потребления воды, энергопотребления и выбросов углерода, а также предлагает более стандартизированные параметры для оценки воздействия на окружающую среду. Google утверждает, что идёт дальше предыдущих исследований, учитывая энергию, потребляемую простаивающими машинами и вспомогательной инфраструктурой центров обработки данных, например, системами охлаждения.

Google утверждает, что за последний год значительно повысила энергоэффективность Gemini, добившись 33-кратного снижения потребления электроэнергии на один запрос. По данным компании, углеродный след медианной подсказки за тот же период сократился в 44 раза. «Мы гордимся инновациями, лежащими в основе нашего повышения эффективности, и намерены продолжать существенно совершенствоваться в ближайшие годы», — говорится в блоге Google.

Однако, реальная картина выглядит более мрачной. Повышение эффективности может привести к увеличению загрязнения из-за опережающего роста потребления ресурсов искусственного интеллекта — к печальному явлению, известному как парадокс Джевонса. Так называемые «выбросы углерода, обусловленные амбициями» Google, выросли на 11 % в прошлом году и на 51 % с 2019 года, поскольку компания продолжает активно развивать ИИ.

ИИ-помощник Google Gemini Live научился видеть мир через камеру смартфона — точно и без задержек

Компания Google анонсировала несколько новых функций для виртуального ассистента Gemini Live, с которым пользователи могут взаимодействовать посредством голосовых команд. В ближайшее время Gemini Live сможет точнее распознавать и выделять объекты, которые пользователь «показывает» ему с помощью камеры своего смартфона.

 Источник изображения: Google

Источник изображения: Google

Это нововведение будет полезным в разных ситуациях. Например, когда пользователь не уверен, какой инструмент лучше подходит для выполнения определённой задачи, он может спросить об этом Gemini Live и задействовать камеру, чтобы ИИ-помощник помог с выбором оптимального варианта. Данная функция будет доступна на анонсированных на этой неделе смартфонах Google Pixel 10. В конце месяца визуальные подсказки станут доступны пользователям других устройств на базе Android, а в течение нескольких недель — в приложении ассистента для iOS.

Вместе с этим разработчики расширили возможности Gemini Live в плане взаимодействия с другими приложениями, включая «Телефон», «Сообщения» и «Часы». Например, если пользователь обсуждает с Gemini Live маршрут до определённого пункта, но понимает, что не успеет вовремя туда добраться. В этом случае пользователь может сказать ИИ-помощнику, что предложенный маршрут его устраивает, но нужно составить и отправить одному из контактов сообщение о том, что он задержится на несколько минут. После этого Gemini Live самостоятельно сгенерирует и отправит указанному контакту сообщение, тем самым предупредив его об опоздании заранее.

Google также анонсировала запуск обновлённой аудиомодели для Gemini Live. За счёт этого алгоритм будет лучше распознавать интонацию человека, ритм и высоту голоса. В скором времени ИИ-ассистент научится менять интонацию в зависимости от того, о чём идёт речь. В дополнение к этому пользователь сможет ускорять и замедлять Gemini Live в зависимости от того, как ему удобнее воспринимать ответы ИИ-помощника. Если же пользователь попросит Gemini Live драматично пересказать какую-то историю от имени конкретного персонажа или исторической фигуры, алгоритм сумеет выдать «насыщенное и увлекательное повествование».

Google отлучила «Ассистента» от умного дома — представлен продвинутый ИИ-помощник Gemini for Home

Google объявила о запуске нового голосового помощника Gemini for Home для умного дома. Ассистент, работающий на основе искусственного интеллекта Gemini, заменит стандартный Google Assistant на умных колонках и дисплеях Nest уже в октябре этого года, сообщает издание The Verge.

 Источник изображения: Curtis Berry/Unsplash

Источник изображения: Curtis Berry/Unsplash

Новый помощник будет управлять умным домом, музыкой, таймерами и отвечать на вопросы, активируясь по фразе «Hey Google». По словам руководителя отдела продуктов Google Home и Nest Аниша Каттукарана (Anish Kattukaran), использование Gemini for Home будет восприниматься как нечто принципиально новое. Ассистент применяет продвинутое логическое мышление и возможности поиска, выполняет более сложные задачи и взаимодействует на естественном языке. Он способен лучше понимать контекст, нюансы и намерения пользователя. Например, он корректно обработает запросы вроде «выключи свет везде, кроме спальни», «поставь песню из летнего блокбастера этого года про гоночные машины», а также упростит создание списков, напоминаний и событий в календаре.

Ключевым улучшением станет интеграция функции Gemini Live, которая обеспечит продолжительный голосовой диалог без необходимости постоянно повторять «Hey Google». Это откроет новые сценарии использования — от детализированной помощи в приготовлении еды из имеющихся продуктов и планирования крупных покупок до решения бытовых проблем или генерации сказок на ночь. Интересно, что аналогичные возможности уже присутствуют в Alexa Plus от Amazon, что ставит Google в условия прямой конкуренции.

Развёртывание нового помощника будет проходить постепенно и осторожно, через программу предварительного тестирования Google Home Public Preview. Такая стратегия связана с повышенными рисками интеграции генеративного ИИ в умный дом, где он потенциально может управлять критически важными устройствами, такими как замки, бытовая техника и системы климат-контроля.

Стоимость платного тарифа Gemini for Home пока не раскрыта, но расширенные функции Gemini Live, скорее всего, войдут в премиальную подписку. Google может пойти по пути Amazon и включить тариф в свои пакеты Nest Aware или Google One. Это предположение подкрепляется недавним повышением цены на Nest Aware до $10 в месяц без существенных обновлений функциональности. Помощник будет работать для всех членов семьи и гостей. Запуск начнётся через программу раннего доступа, при этом Google предложит не только платный, но и бесплатный уровень подписки.

ИИ-бот Gemini научился озвучивать тексты из «Google Документов»

Разработчики из Google продолжают использовать ИИ-модель Gemini для создания новых функций, которые могут оказаться полезными для пользователей. На этот раз алгоритм научился «генерировать аудиоверсии ваших документов», хранящихся в облачном сервисе «Google Документы» с возможностью их последующего воспроизведения голосом.

 Источник изображения: 9to5google.com

Источник изображения: 9to5google.com

Новая опция «Аудио» для преобразования текста в речь появилась в меню «Инструменты», которое можно увидеть в верхней части рабочего пространства при взаимодействии с документами в сервисе «Google Документы». После нажатия кнопки «Прослушать эту вкладку» на экране появится миниатюрный проигрыватель с указанной продолжительностью сгенерированного аудио. Проигрыватель можно переместить в любую часть экрана, а помимо стандартных инструментов воспроизведения в нём также реализована возможность регулировки скорости воспроизведения и интонации голоса, которым проговаривается текст документа.

В дополнение к этому в процессе редактирования можно добавить звуковую кнопку в любом месте файла, чтобы воспользоваться функцией преобразования текста в аудио позднее. Это может оказаться удобным для пользователей платформы, которые на слух лучше усваивают информацию.

В настоящее время упомянутое нововведение поддерживает только английский язык и доступно в веб-версии сервиса «Google Документы». Воспользоваться им в ближайшее время смогут подписчики Google AI Pro и Ultra, а также корпоративные клиенты компании и прочие.

Google Gemini был доступен для россиян всего несколько часов

Чат-бот на основе искусственного интеллекта Google Gemini, неожиданно ставший доступным для россиян ночью 16 августа без официального объявления компании и каких-либо дополнительных условий, также внезапно прекратил работу в России, сообщил «Коммерсантъ». Как предположил 3DNews.ru, вчерашнее снятие ограничений произошло по ошибке.

 Источник изображения: Google Gemini/unsplash.com

Источник изображения: Google Gemini/unsplash.com

В течение нескольких часов россиянам были доступны такие функции Google Gemini, как генерация текста, изображений, создание документов и приложений в разделе Canvas, углубленное изучение документов и поиск информации по ним в разделе Deep Research, сообщил тогда ресурс «РИА Новости». Пользователи могли выбрать модель Gemini 2.5.Pro для рассуждений, математики и программирования, или 2.5 Flash для быстрой помощи с любыми задачами.

По данным «Коммерсанта», доступ к чат-боту был открыт всего на несколько часов — веб-сайт и приложение без проблем загружались с аккаунтов Google, зарегистрированных в РФ, и примерно в 6:00 доступ пропал.

Google прекратила коммерческую деятельность на территории РФ в 2022 году и закрыла свое российское юрлицо в 2023 году. В России недоступна подписка на сервис Google Gemini. «Этот аккаунт не соответствует требованиям для доступа к подписке Google AI», — такое сообщение появляется в ответ на попытку подписаться на сервис из России.

Google Gemini внезапно заработал в России без ограничений и ухищрений

Чат-бот на основе искусственного интеллекта Google Gemini неожиданно стал доступен российским пользователям напрямую, без различных ухищрений и обходных путей. Как показала быстрая проверка редакцией 3DNews, ИИ заработал как в веб-версии, так и в мобильных приложениях на Android и iOS. Причины внезапного снятия ограничений неизвестны — нельзя исключать, что это произошло по ошибке.

 Источник изображения: Google

Источник изображения: Google

Gemini дебютировал в марте 2023 года в США и ещё нескольких странах, а со временем Google открыла доступ и для многих других государств по всему миру. Однако в России ИИ-сервис не был доступен, причём причины не назывались — возможно, Google соблюдала санкции. Несмотря на это, сам сервис с самого начала поддерживал русский язык. Доступны как текстовые функции, так и голосовой ввод и вывод — причём с естественной интонацией и высокой точностью распознавания. Интерфейс мобильной и веб-версии полностью переведён на русский.

Теперь Gemini стал доступен с российского IP-адреса в браузере по адресу gemini.google.com, а также через фирменные приложения Google на Android и iOS — при условии, что они уже установлены. Однако скачать их с российских аккаунтов в Google Play и App Store по-прежнему нельзя — ограничение продолжает действовать на уровне магазинов приложений.

Пока Google официально не подтверждала снятие региональных ограничений. Это может означать, что разблокировка Gemini для пользователей из России произошла случайно — подобные случаи уже случались с другими сервисами в прошлом. Тем не менее, сейчас сервис работает без заметных ограничений.

На фоне появления Gemini особенно заметен контраст с главным конкурентом — ChatGPT от OpenAI. Он по-прежнему официально недоступен в России: сайт не открывается, а приложения не устанавливаются с российских учётных записей. Как и в случае с Google, ограничения действуют со стороны самих разработчиков, а не по техническим или правовым причинам. Остаётся следить за развитием ситуации: Google может как сохранить доступ, так и вновь его закрыть.

Google Gemini научился автоматически запоминать прошлые чаты, но его можно попросить не делать этого

Google обновила помощника с искусственным интеллектом Gemini, добавив чат-боту возможность «запоминать» прошлые переписки с ним без необходимости отправлять специальные запросы. Если включить эту функцию в настройках, Gemini будет автоматически усваивать «ключевые моменты и предпочтения» пользователя и использовать эти сведения для персонализации ответов.

 Источник изображений: blog.google

Источник изображений: blog.google

С одним из прошлогодних обновлений Google Gemini получил возможность «запоминать» личные предпочтения и интересы пользователя, но для этого пользователь должен был отдельно попросить об этом чат-бот. Теперь функция работает в автоматическом режиме. Так, если ранее пользователь обращался к Gemini за советом по поводу тем для YouTube-канала о японской культуре, то в дальнейшем при просьбе просто предложить тему для новых видео ИИ может, например, сразу упомянуть японскую кухню.

На минувшей неделе поднимался вопрос о том, что ChatGPT начал приводить в беседах с некоторыми пользователями явно бредовые идеи, и, по одной из версий, это было связано с тем, что с апреля сервис при общении с пользователем начал обращаться к другим чатам. В OpenAI пообещали, что развернут средства, которые помогут обнаруживать признаки психических и эмоциональных расстройств у пользователей. Проблема не обошла стороной и Google — компания «постоянно» улучшает средства защиты на своих сервисах, заверил представитель компании Элайджа Лаваль (Elijah Lawal). «Мы ведём разработку персонального ИИ-помощника, и ключевую роль в этом играет изучение Gemini ваших предпочтений. Не менее важно обеспечить вас простыми средствами управления для выбора наиболее подходящего варианта, чтобы в любое время эту функцию можно было включить и выключить», — цитирует Лаваля The Verge.

Функция включена по умолчанию, но отключить её можно в настройках приложения Gemini. На начальном этапе она распространяется только на флагманскую модель Gemini 2.5 Pro «в отдельных странах», а в дальнейшем её география расширится, и функции персонализации появятся также у быстрой Gemini 2.5 Flash. Для тех же, кто не хочет пользоваться функцией персонализации постоянно, Google подготовила «Временные чаты» — они не выводятся в списке с остальными, их содержимое используется для персонализации и обучения ИИ, а данные удаляются в течение 72 часов.


window-new
Soft
Hard
Тренды 🔥
Microsoft расширит сотрудничество с Anthropic, но сохранит глубокие связи с OpenAI 11 мин.
Apple выпустит macOS Tahoe с интерфейсом Liquid Glass 15 сентября 4 ч.
«До сих пор отходим от похмелья»: разработчики Ghost of Yotei с размахом отпраздновали перенос GTA VI 12 ч.
Нейросеть Google Veo 3 научилась создавать вертикальные видео для соцсетей 13 ч.
По мотивам «Повести временных лет» выпустят MMORPG на стыке научной фантастики и фэнтези с «эпической историей» и геймплеем «нового уровня» 14 ч.
Антиспам-сервис Microsoft начал блокировать безопасные ссылки в Teams и Exchange Online, и отправлять письма в карантин 14 ч.
Пароли «admin» и другие дыры в кибербезопасности сети ресторанов Burger King выявили белые хакеры 15 ч.
Из Meta продолжается массовый исход специалистов в сфере ИИ — Цукерберг пытается его остановить, но безуспешно 15 ч.
Microsoft тестирует новые ИИ-функции в «Проводнике» Windows 11 15 ч.
Бывший сотрудник подал на WhatsApp в суд из-за игнорирования проблем с кибербезопасностью 17 ч.