Сегодня 24 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → google
Быстрый переход

Google DeepMind представила ИИ-генератор видео Veo 2, который создаёт двухминутные ролики в 4K

Подразделение Google DeepMind представило Veo 2 — основанный на искусственном интеллекте генератор видео нового поколения. Он создаёт видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в 4 раза превосходит OpenAI Sora по разрешению и в 6 раз — по продолжительности видео.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

На данный момент это преимущество, однако, носит лишь теоретический характер: испробовать Veo 2 можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720p, а длина видео — 8 секундами. Для сравнения, доступная для пользователей версия генератора OpenAI Sora предлагает 1080p и 20 секунд. Чтобы начать работу с VideoFX, придётся записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.

Veo 2, как и её предшественница, генерирует видео по текстовым подсказкам, которые можно сопровождать изображениями. По сравнению с Veo первого поколения, новая модель лучше «понимает» физику, изображение отличается повышенной чёткостью, усовершенствованы механизмы движения виртуальной камеры. Veo 2 более реалистично моделирует движение (например, изображает наливаемый в кружку кофе) и свойства света (тени и отражения); правдоподобно имитируются разные линзы на виртуальной камере и кинематографические эффекты.

Разработчик также уверяет, что у новой модели с меньшей вероятностью проявляются галлюцинации: дополнительные пальцы или «неожиданные объекты»; при этом, как показала практика, от эффекта «зловещей долины» избавиться не удалось. А на видео с движущимся автомобилем дорога при ближайшем рассмотрении оказывается чрезвычайно гладкой, пешеходы сливаются друг с другом, а некоторые фасады домов имеют вид, который противоречит законам физики.

Новый генератор видео был обучен на большом числе роликов; в DeepMind не уточнили, какие источники для этого использовались, но одним из них, вероятно, является принадлежащая Google платформа YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых моделью видео.

В DeepMind также сообщили, что улучшили работу генератора статических изображений Imagen 3 — созданные с его помощью картинки стали более яркими, детализированными, а сама модель теперь более точно следует запросам пользователя. В пользовательском интерфейсе ImageFX, где доступен генератор изображений, появились выпадающие списки, которые появляются прямо в поле запроса и помогают добиться более точного результата.

Google Play отключит российских разработчиков от монетизации

Платформа Google Play будет блокировать платежи в платных приложениях разработчиков из России. Это означает, что пользователям таких программных продуктов станут недоступны внутриигровые покупки и обновление подписок. Изменения вступят в силу 26 декабря 2024 года.

 Источник изображения: Brett Jordan/Unsplash

Источник изображения: Brett Jordan/Unsplash

В уведомлении, которое Google начала рассылать разработчикам, сказано, что «на неопределённый срок» приостанавливается проведение платежей за приложения разработчикам, у которых указан для зачисления выплат счёт, зарегистрированный в российском банке. «Это означает, что, начиная с 26 декабря 2024 года мы будем отклонять все попытки пользователей приобрести ваши платные подписки, совершить покупки в приложениях (включая новые подписки) и продлить подписки через Google Play», — говорится в сообщении компании. Там также сказано, что данное изменение вступит в силу в 00:00 26 декабря (по тихоокеанскому времени), а итоговые выплаты разработчики получат до 15 января.

Напомним, в мае 2022 года Google запретила разработчикам из России загружать и обновлять платные приложения в Google Play. Это означало, что в российском сегменте магазина цифрового контента Google перестанут размещаться платные приложения, а значит, разработчики не смогут монетизировать свои продукты. В марте того же года Google отключила показ рекламы для российских пользователей, а позднее заблокировала возможность монетизации просмотров на YouTube. Летом этого года рекламный сервис AdSense полностью прекратил свою деятельность в России и деактивировал учётные записи пользователей, что привело к полной блокировке возможности монетизации контента российских блогеров.

Google и Samsung показали альтернативу Apple Vision Pro — XR-гарнитуру Project Moohan на платформе Android XR

Компании Samsung и Google продемонстрировали в четверг Project Moohan — прототип первой гарнитуры расширенной реальности (extended reality или XR) на базе анонсированной в этот же день программной платформы Google Android XR. Новинку можно назвать ответом на гарнитуру Vision Pro, к тому же она весьма похожа на продукт Apple.

 Источник изображения: Google, Samsung

Источник изображения: Google, Samsung

Как сообщают Samsung и Google, гарнитура Project Moohan будет предлагать весь спектр возможностей XR, от полного погружения в виртуальную реальность до смешанной или дополненной реальности. Moohan в переводе с корейского языка означает «бесконечность». Гарнитура будет отслеживать движения глаз и рук, а также отвечать на голосовые запросы.

При этом Gemini, ИИ-платформа Google, станет центром системы дополненной реальности компании. Сообщается, что «Gemini будет видеть то, что видите вы, и слышать то, что слышите вы». Этим новое носимое устройство будет отличаться от гарнитуры Vision Pro компании Apple, в которую хоть и интегрирован ассистент Apple Siri, но он не обладает на данный момент столь продвинутыми возможностями.

Samsung предпочла не раскрывать ключевые характеристики Project Moohan, такие, как цена, вес, размещение аккумуляторов и технология визуализации, лишь сообщив, что у дисплеев устройства будет «высокое разрешение». Также известно, что в Project Moohan будет использоваться чип или чипы Qualcomm, поскольку ещё в начале прошлого года Samsung, Google и Qualcomm объявили о партнёрстве в разработке новой платформы смешанной реальности. Samsung не уточнила, о каком чипе идёт речь, но вполне логично предположить, что это будет Qualcomm Snapdragon XR2 Plus Gen 2.

Компании объявили, что гарнитура Project Moohan будет представлена в 2025 году.

Android на носу: Google представила операционную систему Android XR для умных очков и AR-гарнитур будущего

В попытке закрепиться на рынке гарнитур виртуальной реальности и умных очков, компания Google представила Android XR — новую операционную систему, созданную для потребительской электроники следующего поколения. Созданная в партнёрстве с Samsung, Android XR можно назвать результатом многих лет инвестиций в искусственный интеллект, дополненную реальность (AR) и виртуальную реальность (VR).

 Источник изображения: Google

Источник изображения: Google

Подробностей о том, как именно будет функционировать Android XR, пока немного. Однако, как сообщает издание The Verge, Google уже адаптирует свои популярные сервисы, такие как «Карты», «Фото» и YouTube, для работы в новой среде. Интересно, что новая ОС будет поддерживать приложения для смартфонов и планшетов из Google Play, аналогично тому, как Apple адаптировала приложения для iPad на Vision Pro. Также разрабатывается версия браузера Chrome с поддержкой многозадачности в режиме XR.

Ключевую роль в работе Android XR играет искусственный интеллект (ИИ) Gemini. Google считает, что именно ИИ способен сделать устройства расширенной реальности (Extended reality или XR) удобным и массовым продуктом. «Мы верим, что интеграция цифрового ассистента в XR-решения станет тем самым ключевым приложением для этой технологии, как в своё время электронная почта или текстовые сообщения стали незаменимыми для смартфонов», — отметил Самир Самат (Sameer Samat), возглавляющий экосистему Android в Google. Эти слова также подтверждаются и тем, что по мере того, как Gemini становится более универсальным, создавая и обрабатывая аудио- и видеоконтент, использование гарнитур и очков становится с каждым днём всё более оправданным.

Интересен и выбор аббревиатуры для новой операционной системы. «XR», по сути, соединил в себе такие понятия как, виртуальная реальность, дополненная реальность, смешанная реальность (MR) и другие, которые частично пересекаются с перечисленными. XR стал наиболее широким определением, вмещающим в себя весь известный на сегодня пространственный спектр. «Когда мы говорим о расширенной реальности или XR, мы имеем в виду весь спектр решений, начиная от виртуальной реальности и заканчивая дополненной и всего, что между ними», — пояснил Самат.

Google видит будущее устройств XR в их универсальности. Гарнитуры должны легко переключаться между виртуальными и реальными мирами, а умные очки могут стать постоянными спутниками человека. Также компанией рассматривается возможность создания устройств, ориентированных исключительно на аудио, аналогичных Ray-Ban Meta Smart Glasses. Некоторые гаджеты будут автономными, некоторые станут дополнением к смартфонам. Пока только открытым остаётся вопрос, будет ли Google производить собственное оборудование для XR или этим займутся партнёры.

Важно отметить, что Android XR сейчас находится на раннем этапе разработки. Разработчики только начинают изучать доступное программное и аппаратное обеспечение для создания приложений под новую ОС. Однако Google планирует ускорить процесс. Уже в следующем году ожидается выход устройства, созданного совместно с Samsung, под кодовым названием Moohan. Осталось только убедить пользователей купить эту гарнитуру.

Победа над Google: магазин приложений Epic будет предустановлен на миллионы Android-смартфонов

Telefónica — один из крупнейших в мире сотовых операторов, управляющий сотовыми сетями O2 и Movistar в Великобритании, Испании, Германии и Латинской Америке — начнёт предустанавливать магазин приложений Epic Games Store на каждый продаваемый смартфон на Android, включая модели Samsung. Telefónica и Epic назвали это частью «долгосрочного партнёрства» по установке магазина приложений и игры Fortnite на «миллионы» устройств оператора.

 Источник изображения: Epic Games

Источник изображения: Epic Games

Соглашение между Telefónica и Epic станет первым большим практическим успехом Epic в борьбе с монополией магазина приложений Google. Ещё в 2020 году Epic подала в суд, утверждая, что Google «заблокировала» или «подкупила» производителей смартфонов и операторов сотовой связи, стремясь не допустить предустановки на телефоны альтернативных магазинов приложений.

В декабре прошлого года федеральный суд единогласно встал на сторону Epic Games в деле Epic против Google, установив, что Google превратила свой магазин приложений Google Play и его платёжную систему в незаконную монополию. В октябре 2024 года судья Джеймс Донато (James Donato) вынес окончательное решение, постановив, что Google должна открыть свою платформу в целях справедливой конкуренции. Теперь эти решения обрели практические формы — один из крупнейших в мире операторов начнёт предустанавливать конкурирующий игровой магазин (который в будущем может также содержать неигровые приложения) в дополнение к магазину приложений Google.

Технически Epic запустила Epic Games Store на мобильных устройствах только в августе этого года. Ранее компания предлагала производителям смартфонов и операторам несколько различных типов приложений для загрузки Fortnite. Epic удалось заключить сделки о предустановке приложений-загрузчиков Fortnite с Samsung, LG, OnePlus и Huawei. Но заметной реальной выгоды эти сделки не принесли — из-за противодействия Google компании OnePlus удалось реализовать соглашение с Epic только в Индии, LG вообще расторгла контракт, а остальные «спустили договорённость на тормозах».

Эксперты утверждают, что Telefónica не была «подкуплена» Google. Компания ранее уже сотрудничала с Epic. Ещё в 2020 году она разрешила клиентам Movistar в Испании включать покупки Fortnite в свой счёт за сотовую связь. Тогда Telefónica могла рассчитывать на получение пяти процентов от стоимости проданных таким образом копий Fortnite.

Пока неясно, последуют ли другие крупные операторы, такие как Verizon и Hutchison (Three, Wind Tre) примеру Telefónica. Также неизвестно, как отреагирует Samsung на предустановку Epic Game Store на свои телефоны, ведь в сентябре этого года Epic подала в суд и на Samsung.

В смартфонах Google Pixel появилось прямое питание от электросети — это продлит срок службы устройства

С последним обновлением у смартфонов Google Pixel появилась возможность заряжаться лишь до 80 % для увеличения срока службы аккумуляторов — по достижении этой отметки они начинают питаться напрямую от сети в обход батареи.

Новая функция с ограничением зарядки до 80 % на смартфонах Google Pixel появилась с выходом декабрьского обновления Android 15 QPR1 — зарядка до 100 % может с течением времени ускорить деградацию источника питания. При достижении 80 % зарядка аккумулятора прекращается, а подключение к сети используется для питания устройства напрямую.

Проверить это на практике решили авторы ресурса Android Authority. Когда телефон бездействовал, он потреблял 0,1 Вт энергии; когда включался экран, этот показатель увеличивался до 0,74 Вт; при запуске приложений уровень энергопотребления составлял уже 2,6 Вт; а ресурсоёмкие бенчмарки повышали показатель в пределах от 4,6 до 7,6 Вт. При отключении опции с зарядкой до 80 % и перехода в режим «Адаптивная зарядка» телефон возвращается к стандартной схеме работы: зарядка до 100 % и питание от аккумулятора.

 Источник изображения: 9to5google.com

Источник изображения: 9to5google.com

Наиболее полезным такой режим, как представляется, будет при запуске ресурсоёмких мобильных игр: устройство сможет получать необходимую энергию, не заряжая и не разряжая батарею, и нагреваться телефон будет не так сильно. Поэтому режим прямого питания зачастую поддерживается игровыми смартфонами. Google рассчитывает увеличить срок службы устройств Pixel до семи лет, и новый режим питания, возможно, поможет компании достичь этой цели.

Google упростила борьбу с преследованиями: Android теперь поможет найти и обезвредить неизвестный Bluetooth-трекер

Google сообщила о выходе двух обновлений для функции оповещения о находящихся рядом неизвестных трекерах, подобных Apple AirTag. Это должно упростить владельцам Android-устройств обнаружение устройств, которые могут использоваться для слежки или в других преступных целях.

 Источник изображения: Google

Источник изображения: Google

Функция обнаружения неизвестных трекеров была представлена в июле 2023 года. Она автоматически отправляет владельцу Android-смартфона уведомление в случае обнаружения рядом с ним Bluetooth-трекера, который не привязан к данному устройству.

Одно из новых обновлений позволяет владельцам Android-смартфонов временно приостановить отправку обновлений местоположения в сеть Find My Device при обнаружении неизвестного трекера. Google заблокирует обновления на 24 часа, поэтому местоположение смартфона не будет видно тем, кто может отслеживать его через трекер.

Второе обновление позволит пользователю в случае получения оповещения о неизвестном трекере определить с помощью функции «Найти рядом» (Find Nearby) место, где он находится. Нажав на уведомление о неизвестном трекере, пользователь увидит на карте место, где неизвестный трекер был замечен в последний раз поблизости. Как только пользователь его найдёт, Google также предложит инструкции по физическому отключению следящего устройства.

Если же обнаружить трекер не удастся, функция Find Nearby подключит смартфон пользователя к трекеру по Bluetooth и будет отображать на карте приближение к нему. Как только пользователь приблизится к указанному месту, он сможет с помощью функции Play Sound попытаться найти трекер с помощью звуковых подсказок.

Раскрыты полные характеристики грядущего смартфона Google Pixel 9a

В Сети появились новые подробности о смартфоне Google Pixel 9a, анонс которого ожидается в середине марта 2025 года. Опубликовавший полные спецификации гаджета ресурс Android Headlines настаивает на их достоверности, поскольку сведения были получены у оператора беспроводных сетей и подтверждены ещё одним источником.

 Источник изображения: @OnLeaks.

Источник изображения: @OnLeaks

По данным Android Headlines, Pixel 9a будет основан на чипсете Tensor G4, который дополнит чип безопасности Titan M2, как и у остальных представителей семейства Pixel 9. Смартфон получит 8 Гбайт оперативной памяти LPDDR5X и 128 или 256 Гбайт встроенного хранилища UFS 3.1.

Дисплей с диагональю 6,285 дюйма и разрешением 2424 × 1080 пикселей будет поддерживать частоту обновления 120 Гц и частоту дискретизации касания 240 Гц. Пиковая яркость составит 2700 кд/м², а в режиме HDR — 1800 кд/м². Для защиты от повреждений будет применено стекло Gorilla Glass 3.

В дисплей будет встроен сканер отпечатков пальцев, вероятно, оптический (в отличие от ультразвуковых у остальных моделей серии). В верхней части экрана расположится 13-Мп камера с датчиком Sony IMX712 и диафрагмой f/2.2. На задней панели будет размещена основная 48-Мп камера с датчиком Samsung ISOCELL GN8 и диафрагмой f/1.7, дополненная 13-Мп камерой с датчиком Sony IMX712 и широкоугольной оптикой с диафрагмой f/2.2.

Аккумулятор ёмкостью 5100 мА·ч предложит проводную зарядку мощностью всего 23 Вт и беспроводную зарядку на 7,5 Вт, а также сможет обеспечить продолжительную автономную работу. Несмотря на более массивную батарею, чем у Pixel 8a, смартфон почти не увеличится в размерах: его габариты составят 154,7 × 73,3 × 8,9 мм, а вес — 185,9 г.

Спецификации смартфона также будут включать адаптеры беспроводной связи Wi-Fi 6E (802.11ax) и Bluetooth 5.3 LE, порт USB Type-C 3.2, чип NFC, стереодинамики и два микрофона. Устройство будут соответствовать стандарту защиты от влаги и пыли IP68. Pixel 9a будет работать на базе Android 15 с поддержкой обновлений в течение семи лет.

Стоимость новинки останется такой же, как у Pixel 8a, — $499.

Google отключит пользователей из Беларуси от платформы AdSense

Сервис контекстной рекламы Google AdSense сообщил о намерении свернуть деятельность в Республике Беларусь и прекратить обслуживание зарегистрированных на территории страны пользовательских учётных записей. Ранее аналогичное решение было принято компанией в отношении российских веб-издателей.

 Источник изображения: support.google.com/admanager

Источник изображения: support.google.com/admanager

«13 декабря 2024 года мы деактивируем все аккаунты менеджера рекламы, AdSense и AdMob пользователей из Беларуси. Это означает, что монетизация через такие учётные записи станет невозможна. Доход за декабрь будет выплачен примерно 21–26 января 2025 года, если в аккаунте не приостановлено получение платежей и достигнуты пороги оплаты»,говорится в сообщении сервиса.

Таким образом, владельцы веб-сайтов, работающие на площадке YouTube видеоблогеры и разработчики приложений из Беларуси полностью лишатся доступа к Google AdSense и предоставляемым рекламной сетью услугам.

Отметим, что это далеко не первые санкционные ограничения в отношении Республики Беларусь. Ранее об уходе из страны сообщили сервисы Docker Hub, Apple Search Ads и Tinder, корпоративный мессенджер Slack, разработчик программного обеспечения Atlassian (Trello, Jira, Confluence и др.), SAP и ряд других крупных иностранных IT-компаний.

Google показала ИИ-агента, который помогает проходить игры, наблюдая за действиями игрока

Google представила новую версию платформы искусственного интеллекта Gemini 2.0, с помощью которой можно создавать ИИ-агентов для советов и подсказок в видеоиграх. Агенты способны анализировать игровой процесс и предлагать оптимальные стратегии, а пользователи смогут получать рекомендации в режиме реального времени.

 Источник изображения: Supercell, theverge.com

Источник изображения: Supercell, theverge.com

Как сообщают в блоге компании генеральный директор Google DeepMind Демис Хассабис (Demis Hassabis) и технический директор Корай Кавукчуоглу (Koray Kavukcuoglu), агенты «делают выводы об игре, основываясь исключительно на действиях на экране, и предлагают решения в режиме реального времени». Кроме того, они могут использовать поиск Google по базам знаний для предоставления более полной информации. Агенты уже тестируются в популярных играх, таких как Clash of Clans и Hay Day от Supercell. Однако, как пишет The Verge, технология находится на ранней стадии разработки, и пока не ясно, насколько полезными такие наставники окажутся для игроков.

Помимо помощи в видеоиграх, Google развивает и другие направления применения Gemini 2.0. Например, ведётся работа над проектом Genie 2, который создаёт виртуальные игровые миры на основе лишь одного изображения. Пока эти миры остаются стабильными только около минуты, однако эксперты видят большой потенциал технологии.

Также компания представила мультимодальные возможности Gemini 2.0 Flash, которые уже доступны разработчикам через API в Google AI Studio и Vertex AI. Новая версия отличается высокой скоростью работы, улучшенной обработкой данных и способностью генерировать изображения и текст, а также преобразовывать текст в речь на нескольких языках. Эти функции уже тестируются ранними партнёрами, а в январе платформа станет доступна широкой аудитории.

Среди других проектов можно выделить Project Astra, Mariner и Jules. Project Astra, созданный для использования на Android-устройствах, был улучшен с помощью Gemini 2.0. Теперь ассистент на базе Astra может разговаривать на нескольких языках, использовать Google Search, Maps и Lens, а также запоминать больше данных, сохраняя при этом конфиденциальность. Project Mariner исследует, как ИИ может помогать в браузере, распознавая текст, изображения, код и другие элементы интерфейса, а Jules предназначен для помощи разработчикам в их рабочих процессах на GitHub.

ИИ-агенты также могут применяться в физическом мире. Исследования Google показывают, что Gemini 2.0 способен использовать пространственное мышление в робототехнике. Хотя эти разработки находятся на ранней стадии, сама компания видит большой потенциал в создании агентов, которые способны взаимодействовать с реальной средой.

Чтобы минимизировать риски и обеспечить безопасность своих ИИ-сервисов, компания проводит масштабные тестирования, сотрудничает с доверенными тестировщиками и внешними экспертами. В ближайшем будущем Google планирует интегрировать возможности Gemini 2.0 во все свои продукты, включая мобильное приложение Gemini.

Google представила Mariner — прототип ИИ-агента для Chrome, которому можно давать сложные поручения

Google представила исследовательский прототип ИИ-агента под названием Project Mariner, который способен выполнять действия в интернете за человека. За разработку отвечает подразделение Google — DeepMind. ИИ-агент на базе Gemini берет под контроль браузер Chrome, перемещает курсор на экране, нажимает кнопки и заполняет формы, что позволяет ему использовать веб-сайты и перемещаться по ним так же, как это делает человек.

 Источник изображений: Google

Источник изображений: Google

Компания сообщила, что в настоящий момент Project Mariner проходит стадию тестирования группой предварительно отобранных пользователей. В разговоре с порталом TechCrunch директор Google Labs Жаклин Конзельманн (Jaclyn Konzelmann) заявила, что Project Mariner представляет собой принципиально новый подход в пользовательском интерфейсе. Проект предлагает отказаться от прямого взаимодействия пользователей с веб-сайтами, возложив эти задачи на генеративную систему ИИ. По её словам, такие изменения могут затронуть миллионы предприятий — от веб-изданий до ритейла — которые традиционно полагались на Google как отправную точку для привлечения пользователей на свои веб-сайты.

После установки и настройки Project Mariner в качестве расширения для браузера Chrome у последнего появится специальное окно чата. В нём можно поручить ИИ-агенту выполнение различных задач. Например, его можно попросить создать корзину покупок в продуктовом магазине на основе заданного списка. После этого ИИ-агент самостоятельно перейдёт на страницу указанного магазина (в демонстрации использовался магазин Safeway), выполнит поиск нужных товаров и добавит их в корзину. Журналисты отмечают, что система работает не так быстро, как хотелось бы: между каждым движением курсора проходит примерно 5 секунд. Иногда ИИ-агент прерывает выполнение задачи и возвращается к окну чата, запрашивая уточнения, например, о весе или количестве товаров.

ИИ-агент от Google не может оформить заказ, так как в его алгоритм не включены функции заполнения номеров кредитных карт и другой платёжной информации. Project Mariner также не принимает файлы cookie и не подписывает соглашения об условиях использования от имени пользователей. Google подчёркивает, что это сделано намеренно, чтобы предоставить пользователям больше контроля.

Кроме того, ИИ-агент делает снимки экрана окна браузера, с чем пользователи должны согласиться перед его использованием. Эти изображения отправляются для обработки в облачный сервис Gemini, который затем передаёт инструкции обратно на устройство пользователя для навигации по веб-странице. Project Mariner можно использовать для поиска рейсов и отелей, покупок товаров для дома, поиска рецептов и других задач, которые сейчас требуют самостоятельной навигации по сайтам.

Одно из основных ограничений Project Mariner заключается в том, что он работает только на активной вкладке браузера Chrome. Иными словами, веб-страница, на которой действует ИИ-агент, должна быть постоянно открыта на экране монитора. Пользователям придётся наблюдать за каждым шагом бота. По словам главного технического директора Google DeepMind Корая Кавукчуоглу (Koray Kavukcuoglu), это сделано специально, чтобы пользователи знали, что именно делает ИИ-агент.

«Поскольку [Gemini] теперь выполняет действия от имени пользователя, важно делать это шаг за шагом. Это дополнительная функция. Вы, как человек, можете использовать веб-сайты, и теперь ваш агент может делать всё, что вы делаете на веб-сайте», — отметил Кавукчуоглу в интервью TechCrunch.

С одной стороны, пользователям всё равно придётся видеть страницу сайта, что выгодно для владельцев ресурсов. Однако использование Project Mariner снижает уровень непосредственного взаимодействия пользователей с функциями сайта и в перспективе может вообще исключить необходимость самостоятельного посещения веб-сайтов.

«Project Mariner — это принципиально новый сдвиг в парадигме UX, который мы наблюдаем прямо сейчас. Нам нужно понять, как правильно всё это настроить, чтобы изменить принципы взаимодействия пользователей с интернетом, а также найти способы, которыми издатели смогут создавать собственные решения для пользователей на базе ИИ-агентов в будущем», — добавила Конзельманн.

Помимо Project Mariner, Google представила несколько других ИИ-агентов для специализированных задач. Например, инструмент Deep Research для глубокого поиска и исследования в интернете. Также был представлен ИИ-агент Jules, предназначенный для помощи разработчикам в написании кода. Он интегрируется в рабочие процессы GitHub, анализирует текущий уровень разработки и может вносить изменения прямо в репозитории. Jules проходит тестирование и станет доступен в 2025 году.

Google DeepMind также разрабатывает ИИ-агента для помощи пользователям в видеоиграх. Для этого компания сотрудничает с разработчиком игр, студией Supercell, чтобы проверить способности Gemini интерпретировать игровые миры на примере Clash of Clans. Сроки запуска прототипа этого ИИ-агента пока неизвестны, но Google подчёркивает, что эта разработка помогает в создании ИИ-агентов для навигации как в реальном, так и в виртуальных мирах.

Google Glass вернутся в виде умных AR-очков с мощным ИИ-ассистентом Astra

Google раскрыла планы по запуску умных очков, интегрированных с проектом Astra — многофункциональным помощником на базе искусственного интеллекта. Устройство обещает стать незаменимым помощником в повседневной жизни, предоставляя информацию и выполняя задачи с помощью голосовых команд и дополненной реальности.

 Источник изображения: Google

Источник изображения: Google

Впервые проект был представлен на конференции Google I/O этой весной, однако Astra пока существует в виде ранних прототипов и, в основном, отражает видение компании в области виртуальных ассистентов. Интересно, что в демонстрации проекта постоянно фигурируют очки. Это неудивительно, ведь Google уже много лет экспериментирует с подобными устройствами — начиная с Google Glass и заканчивая очками-переводчиком Project Iris, представленными два года назад. Ранее в этом году представитель компании Джейн Пак (Jane Park) описала их как «функциональный исследовательский прототип». Однако, по сообщению The Verge, проект уже находится на более продвинутой стадии.

Во время пресс-брифинга, приуроченного к запуску Gemini 2.0, менеджер продукта команды Google DeepMind Бибо Сюй (Bibo Xu) заявила, что небольшая группа пользователей начнёт тестировать прототип очков. Она подчеркнула: «Очки являются одной из самых мощных и интуитивно понятных платформ для взаимодействия с ИИ-ассистентом Astra». Тестирование пройдёт в рамках программы Trusted Tester, участники которой получат доступ к ранним прототипам. Часть тестеров будет использовать Astra на смартфонах Android, а другая — через очки.

Когда журналисты спросили о дальнейших планах относительно умных очков, Сюй отметила: «В ближайшее время появятся новые новости о самом продукте». Хотя это не является прямым подтверждением выхода устройства на рынок, очевидно, что Google рассматривает возможность его выпуска. Очки идеально подходят для реализации идей Astra, так как позволяют комбинировать аудио, видео и дисплей, обеспечивая удобное взаимодействие с ассистентом в формате «всегда включено».

Несмотря на то, что гаджет, включая аналогичные разработки компании Meta, пока остаётся скорее концепцией, Google демонстрирует однозначные намерения воплотить эту идею в жизнь. Недавнее видео с Astra и Gemini 2.0 показывает, как пользователь запоминает коды доступа, проверяет погоду и даже узнаёт, подходит ли проезжающий автобус для нужного направления. Хотя все эти задачи можно выполнить со смартфоном, как отмечает издание The Verge, однако в формате носимого устройства это будет происходить гораздо естественнее. Когда именно устройство поступит на рынок, пока неизвестно.

Google научила ИИ глубоко гуглить — Deep Research тщательно исследует любую тему в интернете

Компания Google представила новый ИИ-инструмент под названием Deep Research, который позволяет чат-боту Gemini проводить тщательный веб-поиск по заданной теме вместо пользователя и составлять детальный отчёт на основе обнаруженной информации.

 Источник изображений: Google

Источник изображений: Google

В настоящий момент Deep Research доступен только для платных подписчиков Gemini Advanced и только на английском языке. Для его активации необходимо выбрать в Gemini в качестве модели «Gemini 1.5 Pro с Deep Research».

При наличии доступа можно попросить Gemini провести исследование на определённую тему. После этого чат-бот составит «план поиска», который можно отредактировать или сразу одобрить. По словам Google, Gemini начнет своё исследование с «поиска интересных фрагментов информации» в интернете, а затем выполнит связанный поиск — процесс, который он повторяет несколько раз.

Когда исследование будет завершено, Gemini выдаст отчёт о своих «ключевых выводах» со ссылками на веб-сайты, где была найдена информация. Пользователь может попросить расширить определённые области поиска, подправить отчёт, а также экспортировать сгенерированное ИИ-исследование в Google Docs. Всё это напоминает функцию Pages, предлагаемую поисковой системой ИИ Perplexity, которая генерирует пользовательскую веб-страницу на основе запроса пользователя.

Google представила Deep Research в рамках более широкого анонса Gemini 2.0 — новой модели для эпохи «агентного» ИИ, или систем, которые способны заменить пользователя в рутинных операциях. Deep Research является лишь одним из примеров ИИ-агентов Google. Другие компании, работающие в сфере ИИ, также разрабатывают аналогичные решения.

Вместе с анонсом Deep Research компания Google также объявила, что Gemini Flash 2.0 — более быстрая версия чат-бота следующего поколения — стала доступна для разработчиков.

Google запустила «всеобъемлющую» ИИ-модель Gemini 2.0, которая может заменить человека

Представлена новая модель ИИ Gemini 2.0 от Google, которая стала предельно универсальной — она генерирует текст, звук и изображения, а также предлагает новые мультимодальные возможности, которые закладывают основу для следующего большого этапа в развитии ИИ: агентов, которые в буквальном смысле могут заменить пользователя в рутинных операциях. Новая модель также стала заметно производительнее и энергоэффективнее.

 Источник изображения: techspot.com

Источник изображения: techspot.com

Как и любая другая компания, участвующая в гонке ИИ, Google лихорадочно встраивает ИИ во всё, до чего может дотянуться, пытаясь создать коммерчески успешные продукты. Одновременно требуется так настроить всю инфраструктуру, чтобы дорогостоящие ИИ-решения не разорили компанию. Тем временем Amazon, Microsoft, Anthropic и OpenAI вливают свои собственные миллиарды в практически тот же самый набор проблем.

Gemini 2.0 представлена примерно через 10 месяцев после выпуска версии 1.5. Генеральный директор Google DeepMind Демис Хассабис (Demis Hassabis) очень высоко оценивает новую модель, называя её «всеобъемлющей», хотя Gemini 2.0 все ещё находится в стадии «экспериментального предварительного просмотра», по терминологии Google. Тем не менее Хассабис уверен, что новая модель предоставит совершенно другой уровень возможностей, в первую очередь в области агентского ИИ.

Агентским ИИ называют ИИ-ботов, которые могут полноценно выполнять действия от имени пользователя. Например, Project Astra от Google — это визуальная система, которая может распознавать объекты, помогает ориентироваться в мире и находить утерянные предметы. По словам Хассабиса, возможности Astra в версии Gemini 2.0 многократно возросли.

Другой пример — Google Project Mariner — экспериментальное расширение для браузера Chrome, которое может буквально подменять пользователя при веб-серфинге. Агент Jules, в свою очередь, помогает разработчикам в поиске и исправлении плохого программного кода. Выпущен даже агент, который помогает лучше играть в видеоигры. Хассабис приводит его в пример в качестве по-настоящему мультимодальной модели ИИ.

«Мы действительно считаем 2025 год настоящим началом эры на основе агентов, — заявил Хассабис, — Gemini 2.0 является её основой». Он также отметил возросшую производительность и энергоэффективность новой модели, особенно на фоне общего замедления прогресса в отрасли ИИ.

План Google относительно Gemini 2.0 заключается в том, чтобы использовать её абсолютно везде. Google ставила своей целью внедрить как можно больше функций в единую модель, а не запускать множество отдельных разрозненных продуктов. «Мультимодальность, различные виды выходных данных, функции — цель состоит в том, чтобы включить все это в основополагающую модель Gemini. Мы пытаемся построить максимально общую модель», — говорит Хассабис.

По словам Хассабиса, с началом агентской эры ИИ потребуется решать как новые, так и старые проблемы. Старые вечны, они касаются производительности, эффективности и стоимости вывода. Новые во многом связаны с рисками в сфере безопасности и конфиденциальности.

Gemini 2.0 на данный момент находится на экспериментальной стадии, причём только в облегчённой версии Gemini 2.0 Flash. Выход окончательной версии запланирован на начало следующего года.

«Нам нужно генерировать прибыль»: Google нарастит присутствие ИИ в поиске

Холдинг Alphabet, в который входит Google, активно развивается в самых разных областях, в том числе на направлении беспилотного транспорта и квантовых вычислений, но приоритетным направлением для него остаётся веб-поиск. Здесь компания намерена увеличивать присутствие искусственного интеллекта.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

Применение ИИ в поиске, который сделал бренд Google именем нарицательным, остаётся самой крупной ставкой для компании, заявила на конференции Reuters NEXT президент и главный инвестиционный директор Alphabet Рут Порат (Ruth Porat). «Мы встретим людей там, где они хотят оказаться», — рассказала топ-менеджер. Годовая выручка Alphabet составляет более $300 млрд, и бо́льшая часть этой суммы поступает от связанной с поиском рекламы.

Прока что в поиск компания внедрила создаваемые генеративным ИИ сводки для запросов без очевидного ответа. Google была вынуждена пойти на этот шаг из-за конкуренции со стороны OpenAI ChatGPT. Но компании пришлось столкнуться с «галлюцинациями» ИИ, когда он даёт явно неправильные ответы. Google намерена продолжать развитие поиска с ИИ.

Ещё одной ключевой инвестицией являются облачные услуги. Alphabet достигла значительных результатов в области здравоохранения; входящее в холдинг подразделение Isomorphic Labs разрабатывает медицинские препараты, используя ИИ AlphaFold, который предсказывает структуры белковых молекул. ИИ, по мнению Порат, поможет сохранить зрение людям, которые рискуют его потерять; а медицинским работникам не придётся больше подолгу работать у экранов в ущерб времени, которое они могут потратить на лечение пациентов.

В 2024 году компания потратит $50 млрд на чипы, центры обработки данных и другие капитальные расходы; но и о результативности она забывать не намерена. «Нам нужно генерировать прибыль», — отметила президент Alphabet.


window-new
Soft
Hard
Тренды 🔥
Надёжный инсайдер раскрыл, когда в Game Pass добавят Call of Duty: World at War и Singularity 45 мин.
Лавкрафтианские ужасы на море: Epic Games Store устроил раздачу рыболовного хоррора Dredge, но не для российских игроков 2 ч.
VK запустила инициативу OpenVK для публикации ПО с открытым кодом 3 ч.
CD Projekt Red объяснила, почему оставила мужскую версию Ви за бортом кроссовера Fortnite и Cyberpunk 2077 4 ч.
Открытое ПО превратилось в многомиллиардную индустрию 5 ч.
Слухи: в вакансиях Blizzard нашли намёки на Diablo V 5 ч.
Nvidia App получило обновление, которое исправило замедление игр — «тормозящие» фильтры теперь отключены по умолчанию 7 ч.
Microsoft перестала полагаться только на ИИ-разработки OpenAI 7 ч.
Индустрия компьютерных клубов в России по итогам 2024 года достигла 25 миллиардов рублей и «продолжит расти ещё в течение четырёх−пяти лет» 8 ч.
VK представила платформу OpenVK для публикации открытого ПО, причём не только своего 9 ч.