Сегодня 29 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gemini
Быстрый переход

Исследователи обучили конкурента OpenAI o1 менее чем за полчаса и $50

Исследователи из Стэнфорда и Университета Вашингтона создали ИИ-модель, которая превосходит OpenAI в решении математических задач. Модель, получившая название s1, была обучена на ограниченном наборе данных из 1000 вопросов методом дистилляции. Это позволило достичь высокой эффективности при минимальных ресурсах и доказать, что крупным компаниям, таким как OpenAI, Microsoft, Meta и Google, возможно не придётся строить огромные дата-центры, заполняя их тысячами графических процессоров Nvidia.

 Источник изображения: Growtika / Unsplash

Источник изображения: Growtika / Unsplash

Метод дистилляции, который применили учёные, стал ключевым решением в эксперименте. Этот подход позволяет небольшим моделям обучаться на ответах, предоставленных более крупными ИИ-моделями. В данном случае, как пишет The Verge, s1 быстро улучшала свои способности, используя ответы, полученные от модели искусственного интеллекта Gemini 2.0 Flash Thinking Experimental, разработанной компанией Google.

Модель s1 была создана на основе проекта Qwen2.5 от Alibaba (подразделение Cloud) с открытым исходным кодом. Первоначально исследователи использовали набор данных из 59 000 вопросов, но в ходе экспериментов пришли к выводу, что увеличение объёма данных не даёт значимых улучшений, и для финального обучения использовали лишь небольшой набор из 1000 вопросов. При этом было использовано всего 16 GPU Nvidia H100 в облаке, за использование которых пришлось заплатить менее $50.

В s1 была также применена техника под названием «масштабирование времени тестирования», которая позволяет модели «поразмышлять» перед генерацией ответа. Также исследователи стимулировали модель к перепроверке своих выводов путём добавления команды в виде слова «Wait» («Жди»), что заставляло ИИ продолжать рассуждение и исправлять ошибки в своих ответах.

Утверждается, что модель s1 показала впечатляющие результаты и смогла превзойти OpenAI o1-preview на 27 % при решении математических задач. Недавно нашумевшая модель R1 от DeepSeek также использовала аналогичный подход и за сравнительно небольшие деньги. Правда, теперь OpenAI обвиняет DeepSeek в извлечении информации из своих моделей в нарушение условий обслуживания. Стоит сказать, что и в условиях использования Google Gemini указано, что её API запрещено применять для создания конкурирующих чат-ботов.

Рост количества меньших и более дешёвых моделей может, по словам экспертов, перевернуть всю отрасль и доказать, что нет необходимости инвестировать миллиарды долларов на обучение ИИ, строить огромные центры обработки данных и закупать в большом количестве GPU.

Google открыла для всех ИИ-модель Gemini 2.0 Flash Thinking с «мультимодальным мышлением»

Компания Google представила масштабное обновление своей платформы искусственного интеллекта Gemini, добавив в приложение экспериментальную модель с функцией «рассуждения». Эта модель, получившая название Gemini 2.0 Flash Thinking, объясняет ход своих рассуждений перед тем, как ответить на сложный вопрос. Обновление стало частью крупного релиза Gemini 2.0, который также включает флагманскую модель Gemini 2.0 Pro.

 Источник изображения: blog.google

Источник изображения: blog.google

Модель Gemini 2.0 Flash Thinking была впервые представлена в декабре 2024 года и должна была составить конкуренцию аналогичным рассуждающим ИИ-моделям, таким как o1 от OpenAI и R1 от DeepSeek. Как сообщает The Verge, суть системы заключается в способности разбивать задачи на более мелкие шаги перед тем, как предложить решение. Такой подход, по мнению разработчиков, помогает добиться более точных результатов, хотя итоговый ответ может занимать больше времени.

Новые возможности уже доступны пользователям на десктопных и мобильных устройствах. Gemini 2.0 Flash Thinking можно выбрать в окне приложения через выпадающий список моделей. Также с обновлением появилась возможность использовать функции искусственного интеллекта (ИИ) в других приложениях Google, таких как YouTube, «Поиск» и Google Карты.

Помимо Flash Thinking, вышла экспериментальная версия Gemini 2.0 Pro, которая, по слухам, обладает более высокой точностью и улучшенными характеристиками для решения задач, связанных с программированием и математикой, и, по словам компании, является «самой мощной моделью» в линейке. Версия Pro будет доступна пользователям тарифного плана Advanced Gemini, а также клиентам, имеющим доступ к Vertex AI и AI Studio.

Также представлена бюджетная модель Gemini 2.0 Flash-Lite, которая сохраняет скорость и стоимость предшественника (версии 1.5 Flash), но показывает лучшие результаты в большинстве тестов. Flash-Lite доступна в режиме публичного тестирования через AI Studio и Vertex AI.

Стоит отметить, что на фоне высочайшей конкуренции и противостояния таким компаниям, как OpenAI, Microsoft, Meta и Anthropic, Google активно наращивает инвестиции в развитие искусственного интеллекта. В 2025 году компания планирует потратить на эти цели $75 млрд, что более чем в два раза превышает расходы 2023 года ($32,3 миллиарда), и обновление Gemini 2.0 является частью этих планов.

У Google появились «очень хорошие идеи» по интеграции рекламы в ИИ-помощника Gemini

На данный момент в ИИ-помощнике Google Gemini нет рекламы, но у компании есть «очень хорошие идеи» как изменить это в будущем. Об этом заявил генеральный директор Google Сундар Пичаи (Sundar Pichai) во время прошедшей на этой неделе встречи с инвесторами.

 Источник изображения: Google

Источник изображения: Google

В настоящее время пользователи могут получить бесплатный доступ к Gemini или взаимодействовать с ИИ-помощником в рамках платной подписки, включающей в себя дополнительные возможности. Похоже, что в будущем рекламный контент может стать одной из частей этого продукта.

В ходе беседы аналитик Wells Fargo спросил Пичаи, что следует думать о «будущих возможностях монетизации Gemini», и видит ли компания потенциальную «рекламную составляющую». «Что касается монетизации, то на данный момент мы сосредоточились на бесплатном доступе и подписках. Но, как вы уже могли убедиться на опыте работы с Google, мы всегда стремимся к тому, чтобы пользователи чувствовали себя лучше, и у нас есть очень хорошие идеи для концепции нативной рекламы. Вы увидите, что мы лидируем в области взаимодействия с пользователями», — ответил Пичаи.

Пичаи добавил, что Google стремится к тому, чтобы продукты компании охватывали миллиарды пользователей, а реклама всегда была важным аспектом этой стратегии. «Как вы уже видели в случае с YouTube, со временем мы дадим людям возможность выбора. Но в этом году, я думаю, вы увидите, что мы сосредоточимся на подписке», — добавил Пичаи. Также было сказано, что в этом году Google потратит $75 млрд на развитие ИИ-технологий.

Судя по всему, пользователям не следует ожидать появления рекламы в Gemini по крайней мере в этом году. Однако реклама занимает важное место в бизнесе Google, поэтому стоит ожидать, что в какой-то момент рекламный контент появится в ИИ-помощнике, как это уже было в запущенных недавно ИИ-сводках в поисковом сервисе компании.

Google развернула модель Gemini Flash 2.0 для всех пользователей

Google развернула нейросеть Gemini Flash 2.0 для всех пользователей приложения Gemini на настольных компьютерах и мобильных устройствах — по сведениям ресурса ZDNET, на практике десктопная версия обновляется быстрее.

 Источник изображения: blog.google

Источник изображения: blog.google

Модель Gemini 2.0 Flash имеет более высокую производительность и даёт более быстрые ответы в сравнении с предшественницей, утверждает Google; чат-бот готов помочь с такими задачами как написание текстов, участие в мозговом штурме и помощь с обучающими материалами, а работа с ним стала более комфортной. Обновлённый вариант системы теперь лучше реагирует на загружаемые изображения — другие типы файлов пользователи бесплатной версии отправлять не могут.

Экспериментальный вариант модели Gemini 2.0 Flash компания Google представила в конце прошлого года, охарактеризовав её как «рабочую лошадку с низкой задержкой» — она, по словам создателя, справляется с написанием программного кода, решением математических задач и рассуждениями, работая вдвое быстрее предшественницы — Gemini 1.5 Flash. Ранее Google Gemini 2.0 Flash была доступна только подписчикам Gemini Advanced за $19,99 в месяц — для них открыто контекстное окно в 1 млн токенов (1500 страниц текста), приоритетный доступ к функциям Deep Research и Gems, 2 Тбайт хранилища Google One и возможность загрузки репозитория кода. Модели Gemini 1.5 Flash и 1.5 Pro пока продолжат работу в ближайшие недели.

Google также объявила, что завершила развёртывание модели Imagen 3 в генераторе изображений Gemini для всех пользователей. Эта модель предлагает улучшенную детализацию, более качественные эффекты освещения и уменьшенное число артефактов.

Google научила ИИ-чат-бот Gemini создавать диаграммы и визуализировать данные из таблиц

Разработчики из Google продолжают расширять интеграцию своего ИИ-бота Gemini с разными сервисами компании. На этот раз алгоритм получил новые возможности в сервисе «Google Таблицы». Пользователи могут задействовать Gemini для построения диаграмм на основе собственных данных, а также для анализа тенденций, выявления закономерностей и связей между разными показателями.

 Источник изображения: Google

Источник изображения: Google

Созданные с помощью Gemini диаграммы представляют собой изображения, которые, например, в дальнейшем можно вставить в презентацию или какой-либо документ. Поскольку алгоритм создаёт статические изображения, пользователям нужно будет генерировать изображения каждый раз после обновления данных, на основе которых создаются диаграммы.

Отмечается, что на точность работы Gemini могут влиять некоторые факторы, включая непоследовательное форматирование данных или отсутствие некоторых значений. Кроме того, снизить качество генерируемых диаграмм могут недостаточно точные подсказки, с помощью которых пользователь объясняет чат-боту, что именно хочет получить в конечном итоге.

Функция генерации изображений диаграмм, а также другие опции, позволяющие анализировать данные, в ближайшее время станут доступны подписчикам Google One AI Premium за $19,99, а также платным подписчикам платформы Google Workspace и пользователям продуктов Gemini Enterprise, Gemini Business и Gemini Education Premium. Масштабное развёртывание новых инструментов займёт несколько недель.

Google: хакеры из России, Ирана и других стран не преуспели в привлечении ИИ Gemini к своей деятельности

Хакерские группировки, предположительно связанные с Ираном, Северной Кореей, Китаем и Россией, пытались использовать искусственный интеллект Google Gemini для развёртывания различных атак. Значительного успеха киберпреступникам добиться не удалось, но система помогла им автоматизировать некоторые задачи, рассказали в Google.

 Источник изображения: Kevin Ku / unsplash.com

Источник изображения: Kevin Ku / unsplash.com

«Хотя ИИ может оказаться полезным средством для злоумышленников, он пока не настолько меняет правила игры, как его порой изображают», — говорится в блоге Google. Хакеры смогли использовать возможности Gemini в противоправных целях: для перевода контента, совершенствования фишинговых атак и написания программного кода. Наиболее активными пользователями Gemini оказались киберпреступники, связанные, по версии Google, с Ираном. Они применяли ИИ для изучения организаций в оборонной отрасли, исследования уязвимостей и генерации контента для фишинговых кампаний.

Использовать Gemini для непосредственного взлома систем у них не получилось, но автоматизировать некоторые свои задачи злоумышленники всё-таки смогли: ИИ помог им в исследованиях, разъяснении сложных концепций, создании и отладке кода. При попытке применить систему для захвата учётных записей или взлома самого Gemini сработали защитные механизмы. Система отказалась подготовить руководство по неправомерному использованию продуктов Google, разработать продвинутые методы фишинга, помочь в создании средств кражи информации из браузера Chrome и методов обхода средств проверки при регистрации учётных записей в Google. Gemini не стал создавать вредоносное ПО или другой контент, который можно было бы использовать при реализации атак.

Но всё-таки ИИ помог киберпреступникам повысить качество перевода пропагандистских материалов, сопроводительных писем для связи со специалистами через профессиональную соцсеть LinkedIn и получения информации об обмене работниками за рубежом. Схожий доклад в прошлом году опубликовали Microsoft и OpenAI: киберпреступники смогли автоматизировать часть своих задач при помощи ИИ, но не добились каких-то прорывов. В Google заявили, что внимательно изучают случаи злоупотребления продуктами компании, стремятся пресекать подобные инциденты и при необходимости привлекают правоохранительные органы.

Google упростила управление умным домом — Google Home получил ИИ-помощника Gemini

Управление умным домом в экосистеме Google через помощника с искусственным интеллектом Gemini стало доступно для всех пользователей. Ассистент позволяет настраивать умное освещение, климатическую систему в доме, умные колонки и другие совместимые устройства в учётной записи Google.

 Источник изображения: blog.google

Источник изображения: blog.google

Масштабное обновление платформы умного дома Google анонсировала в ноябре. Теперь для управления его функциями можно отдавать команды естественным языком: услышав фразу «солнце в гостиной светит слишком ярко», система закроет жалюзи. ИИ Gemini способен выполнять несколько запросов сразу — можно сказать, например: «Включи свет у кресла, но приглуши лампу на кухне». Помощнику также можно задавать вопросы о статусе устройств, например, включён ли свет на крыльце.

Управление «некритическими» устройствами умного дома, такими как светильники, вынесено на экран блокировки телефона. Появилась возможность регулировать громкость, приостанавливать и возобновлять воспроизведение на умных колонках, дисплеях и умных телевизорах прямо в приложении Gemini; здесь же появился интерфейс управления климатической системой, повторяющий дизайн соответствующего раздела Google Home. При обращении к камерам наблюдения и замкам помощник с ИИ теперь автоматически открывает приложение Google Home. Развёртывание новых функций начинается сегодня, но будет происходить постепенно — у всех пользователей экосистемы они появятся «в ближайшие недели».

Google научила ИИ Gemini использовать сразу несколько приложений для одного запроса

Компания Google объявила о масштабном обновлении ИИ-ассистента Gemini, который теперь сможет выполнять задачи, затрагивающие несколько приложений, в рамках одного запроса. Обновление было анонсировано одновременно с запуском новых устройств Samsung Galaxy S25, в которых Gemini станет виртуальным ассистентом по умолчанию, заменив «коллегу» Bixby.

 Источник изображения: Google

Источник изображения: Google

Как сообщает The Verge, теперь Gemini способен на выполнение более сложных мультимодальных задач. Например, по запросу пользователя ассистент сможет найти ресторан итальянской кухни, где разрешено посещение с собаками, и сразу же отправить информацию об этом другу. В другом примере Gemini сможет найти расписание предстоящих игр любимой команды и добавить эту информацию в календарь, так же в рамках одного запроса.

Ранее функциональность взаимодействия с несколькими приложениями была основана на существующих расширениях Gemini, которые охватывали ряд приложений Google и ограниченное количество сторонних сервисов, таких как WhatsApp и Spotify. С сегодняшним же обновлением в этот список добавлены приложения Samsung для пользователей S25, включая Samsung Calendar, Notes, Reminder и Clock. При этом возможность использования одновременно нескольких расширений Gemini доступна для всех пользователей Android, iOS, а также через веб-браузер.

Также получил обновление голосовой режим Gemini Live, но пока функция доступна только для телефонов Galaxy S25 и S24, а также для серии Google Pixel 9. Владельцы этих устройств смогут отправлять изображения, файлы и видео с YouTube в интерфейс чата, запрашивая у Gemini отзывы и информацию. Google также сообщает, что анонсированные ранее возможности мультимодальной модели Project Astra, такие как совместное использование экрана и потоковая передача видео в реальном времени, появятся на Android в ближайшие месяцы.

Улучшена функция и Circle to Search. Теперь она автоматически распознаёт телефонные номера, адреса электронной почты и ссылки для упрощения взаимодействия. Кроме того, ИИ-обзоры в поисковых результатах стали поддерживать больше типов визуальных данных, включая изображения мест, объектов и произведений искусства.

Google также объявила об изменениях, которые упростят подключение брайлевских дисплеев и слуховых аппаратов к устройствам Android, сделав технологию более доступной для людей с ограниченными возможностями. Напомним, все эти нововведения были представлены на мероприятии Galaxy Unpacked, где Samsung также анонсировала свои новые устройства, включая Galaxy S25, S25 Plus, S25 Ultra и Galaxy Watch 7 LTE.

Google заявила, что её ИИ самый лучший в мире — осталось убедить людей им пользоваться

Компания Google утверждает, что является лидером в области разработки технологии искусственного интеллекта, и её ИИ-модель Gemini превосходит возможности конкурентов. Однако по количеству пользователей ChatGPT вышел вперёд. В настоящее время, количество активной аудитории Gemini не разглашается, в то время как ChatGPT еженедельно посещают 300 миллионов пользователей.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Несмотря на то, что Google является одним из пионеров в области искусственного интеллекта (ИИ), компания была застигнута врасплох запуском ChatGPT в конце 2022 года. С тех пор Google активно работает в этом направлении, внедряя новые функции и стремясь занять лидирующие позиции. Недавно технология Gemini даже обошла OpenAI в рейтингах Chatbot AI. Однако приложение Gemini по-прежнему отстаёт от ChatGPT по количеству скачиваний — 106 миллионов против 465 миллионов, сообщает The Wall Street Journal, ссылаясь на статистику App Store.

Отмечается, что хотя Gemini пока не приносит значительных доходов, предлагая премиум-версию чат-бота по подписке за $20 в месяц, однако является ключевым элементом стратегии Google в области ИИ, влияя на основные направления бизнеса, такие как поиск и реклама. Также, несмотря на то, что в платной версии добавлены различные бонусы и 2 Тбайт облачного хранилища, не все пользователи выбирают подписку ради самого ИИ. Например, специалист по данным из Филадельфии Сифэй Хан (Sifei Han) отметил, что в Gemini ценит дополнительные возможности хранения, но предпочитает стиль ChatGPT.

Согласно данным аналитической компании из США Earnest Analytics, около 60 % платных пользователей Gemini сохраняют подписку спустя шесть месяцев после её оформления. Этот показатель лучше, чем у некоторых конкурентов, таких как Character.AI и Perplexity, но всё же уступает OpenAI и Anthropic.

Стоит сказать, что технология Gemini уже используется в различных продуктах Google, включая «обзоры ИИ» (AI overviews) в поисковой выдаче, в бизнес-версиях Gmail и Google Drive. Компания также активно продвигает Gemini в качестве помощника по умолчанию на мобильных устройствах, в том числе на своих телефонах Pixel и на устройствах Motorola и OnePlus.

ИИ в Gmail, «Документах» и прочих сервисах Google стал бесплатным, но подписка Workspace подорожала

Ранее для использования всех функций ИИ в Gmail, «Документах», «Таблицах», Meet и остальных приложениях Google Workspace, требовалось оплатить тарифный план Gemini Business за $20 в месяц для каждого пользователя. С 14 января этот тарифный план стал бесплатным — Google добавила все функции ИИ в Workspace, стремясь не проиграть в конкурентной борьбе с Microsoft, OpenAI и другими в создании офисного пакета будущего на базе ИИ.

 Источник изображения: techspot.com

Источник изображения: techspot.com

Однако в этой бочке мёда имеется и ложка дёгтя — одновременно с отменой платы за ИИ-функции Google повысила цену на все варианты подписки Workspace. Компаниям придётся в среднем платить примерно на $2 в месяц больше за каждого пользователя Workspace. Конечно, контракты крупных компаний могут предусматривать другие условия, но базовая цена подписки выросла с $12 до $14 в месяц.

ИИ-функции Workspace включают доступ к чат-боту Gemini, сводки электронной почты в Gmail, дизайны для электронных таблиц и видео, автоматизированный конспект для совещаний, мощный помощник по исследованиям NotebookLM и инструменты для письма в приложениях.

По словам президента Google по облачным приложениям Джерри Дишлера (Jerry Dischler), Google предлагает наиболее вертикально интегрированный ИИ-продукт, но это имеет значение только в том случае, если люди используют всю систему. «В большинстве случаев, когда мы общаемся с компаниями, которые используют ИИ, главным препятствием становятся соображения стоимости, — говорит он. — Вот почему они так осторожно подходят к этому. Типа: “Ого, это куча денег, и давайте докажем ценность”. Хорошо, теперь вы получаете ИИ [бесплатно]. У вас есть ценность».

Google не единственная компания, которая отказалась от наценки за ИИ: в ноябре 2024 года Microsoft объявила, что функции ИИ Copilot Pro, которые ранее стоили $20 в месяц, станут частью стандартной подписки Microsoft 365. Другие поставщики решений ИИ также делают ставку на то, что «бесплатный» доступ к ИИ окупится в долгосрочной перспективе.

Генеративный ИИ от Google прописался в автомобилях Mercedes-Benz

Google Cloud представила «новый способ для автопроизводителей использовать полезные генеративные возможности ИИ». Новый автомобильный агент ИИ от Google позволяет автопроизводителям создавать персонализированных и интуитивно понятных ИИ-помощников, которые умеют поддерживать беседу и отвечать на сложные вопросы, такие как «Есть ли поблизости итальянский ресторан?», «Какие о нём отзывы?» и «Какое там самое популярное блюдо?».

 Источник изображения: techspot.com

Источник изображения: techspot.com

Mercedes-Benz и Google Cloud сегодня объявили о расширении своего стратегического партнёрства с целью внедрения новых разговорных возможностей в виртуального помощника MBUX на основе ИИ-агента Google Cloud Automotive AI Agent. Созданный с использованием Gemini на основе Vertex AI, Google Cloud Automotive AI Agent специально настроен для автомобильной промышленности и напрямую взаимодействует с платформой Google Maps.

Mercedes-Benz является одним из первых автопроизводителей, внедривших автомобильного агента ИИ в свой виртуальный помощник MBUX, который появится в новом Mercedes-Benz CLA в конце этого года. По словам Google, «усовершенствованный виртуальный помощник MBUX предлагает свежую и достоверную информацию с платформы Google Maps и позволяет водителям и пассажирам использовать голосовые команды для получения персонализированной информации о точках интереса, условиях дорожного движения и многом другом за считанные секунды».

Агент Google Cloud Automotive AI Agent также позволит виртуальному помощнику MBUX обрабатывать сложные многоуровневые диалоги и запоминать разговоры, чтобы продолжить общение на ту же тему позже.

«В Mercedes-Benz мы стремимся предложить нашим клиентам исключительный цифровой опыт. Наше партнёрство с Google Cloud ещё больше улучшит навигацию в автомобиле, объединив сложные данные о местоположении с генеративным ИИ. Запущенная с новым CLA, наша навигация следующего поколения позволит водителям и пассажирам использовать голосовые команды для получения полной и персонализированной информации в течение нескольких секунд», — заявил генеральный директор Mercedes-Benz Group AG Ола Келлениус (Ola Källenius).

«Mercedes-Benz известен тем, что обеспечивает невероятный опыт вождения, и наше партнёрство принесёт передовые достижения в области искусственного интеллекта, чтобы сделать этот опыт ещё лучше. Наш новый агент Automotive AI Agent поможет водителям ориентироваться и осуществлять поиск с помощью помощников в автомобиле, поэтому эти взаимодействия будут более естественными и полезными. Это только начало того, как агентские возможности могут преобразовать автомобильную промышленность, и я рад видеть, как наше партнёрство продвигает прогресс вперёд», — полагает генеральный директор Google Сундар Пичаи (Sundar Pichai).

Новая функция поиска и навигации Point-of-Interest с улучшенным ИИ появится в новом Mercedes-Benz CLA в конце этого года. Это будет первый автомобиль, разработанный с новой операционной системой Mercedes-Benz MB.OS. В дальнейшем планируется внедрение новых ИИ-функций в другие модели.

Google сделает использование телевизора более интуитивным и полезным, подселив нейросети Gemini в Google TV

Google TV получит интеграцию с нейросетью Gemini, что позволит сделать взаимодействие пользователя с телевизором «более интуитивным и полезным», объявила Google на выставке CES 2025. Благодаря обновлению Google TV, которое выйдет в этом году, пользователи смогут искать контент и задавать вопросы, не начиная с фразы «Окей, Google», пишет The Verge.

 Источник изображений: Google

Источник изображений: Google

Для поиска медиа будет достаточно спросить: «Какие последние фильмы от Disney?». Также можно будет задавать более общие вопросы, такие как: «Какие места лучше всего посетить в Азии летом?», и Google TV покажет результаты с YouTube. Интеграция с нейросетью также позволит пользователям взаимодействовать с устройствами умного дома, предоставляя возможность просматривать видеопоток с дверного звонка, приглушать свет и выполнять другие действия. Аналогичные функции Gemini компания добавила в ТВ-приставку Google TV Streamer, вышедшую в прошлом году.

Помимо интеграции Google TV с Gemini, компания оснащает телевизоры с использованием своей операционной системы микрофонами дальнего радиуса действия, что позволяет управлять телевизором с помощью голосовых команд напрямую, без необходимости использования пульта дистанционного управления. Телевизоры с Google TV также получат датчики приближения, которые будут определять, когда пользователь находится рядом с телевизором, и показывать «персонализированные и информативные виджеты» с информацией о погоде или новостями.

Добавим, что LG и Samsung объявили по планах использовать ИИ-ассистента Microsoft Copilot в своих телевизорах.

Google применила конкурирующего ИИ-бота Anthropic Claude для улучшения своих нейросетей Gemini

Контрактные партнёры Google, работающие над повышением качества ответов ИИ-чат-бота Google Gemini, сравнивают их с ответами конкурирующего чат-бота Claude компании Anthropic, пишет ресурс TechCrunch со ссылкой на внутреннюю переписку компании. При этом Google оставила без ответа вопрос TechCrunch по поводу того, получила ли она разрешение на использование Claude в тестировании с Gemini.

 Источник изображения: Google

Источник изображения: Google

Эффективность разрабатываемых ИИ-моделей в сравнении с разработками конкурентов компании зачастую оценивают, используя отраслевые бенчмарки, а не поручая подрядчикам сравнивать с возможностями ИИ своих конкурентов.

Привлечённые Google контрактные разработчики, занимающиеся улучшением Gemini, должны оценивать каждый ответ модели по нескольким критериям, таким как достоверность и уровень детализации. Согласно переписке, опубликованной TechCrunch, им выделяется до 30 минут на каждый запрос, чтобы определить, чей ответ лучше — Gemini или Claude.

Разработчики сообщают, что в ответах Claude больше внимания уделяется безопасности, чем у Gemini. «Настройки безопасности у Claude самые строгие» среди моделей ИИ, отметил один из контрактных разработчиков в служебном чате. В некоторых случаях Claude не реагировал на подсказки, которые он считал небезопасными, например, предложение ролевой игры с другим ИИ-помощником. В другом случае Claude уклонился от ответа на подсказку, в то время как ответ Gemini был отмечен как «грубое нарушение правил безопасности», поскольку включал «обнажение тела и связывание».

Шира Макнамара (Shira McNamara), представитель Google DeepMind, разработчика Gemini, не ответила на вопрос TechCrunch о том, получила ли Google разрешение Anthropic на использование Claude. Она уточнила, что DeepMind «сравнивает результаты моделирования» для оценки, но не обучает Gemini работе с моделями компании Anthropic. «Любое предположение о том, что мы использовали модели Anthropic для обучения Gemini, является неточным», — заявила Макнамара.

Google представила первую ИИ-модель, которая рассуждает «вслух»

Компания Google представила новую экспериментальную модель искусственного интеллекта Gemini 2.0 Flash Thinking, которая, вероятно, станет конкурентом ИИ-модели o1 от OpenAI. Она также способна размышлять и отвечать на сложные вопросы, но помимо этого она также может пояснять ход своих «мыслей», сообщает The Verge.

 Источник изображений: Google

Источник изображений: Google

Главный научный сотрудник Google DeepMind Джефф Дин (Jeff Dean) в своём посте в X отметил, что модель в целях усиления логических рассуждений обучена «мыслить», а также обладает высокой скоростью обработки данных благодаря обновлённой технологии Gemini Flash 2.0. В одном из примеров показано, как модель решает задачу по физике, последовательно «размышляя» шаг за шагом перед тем, как выдать правильное решение. И хотя такой процесс не является аналогом мышления человека, однако позволяет алгоритму разбивать сложные задачи на более мелкие, что приводит к более точным и надёжным результатам.

Ещё один пример работы Gemini 2.0 Flash Thinking, представленный менеджером по продукту Google Логаном Килпатриком (Logan Kilpatrick) в своём аккаунте X, продемонстрировал, как модель решала задачу, в которой были скомбинированы текстовые и визуальные элементы.

Стоит сказать, что последние недели оказались насыщенными новостями в сфере ИИ. Недавно Google представила обновлённую версию своей модели Gemini 2.0, подчёркивая стремление развивать «агентский» ИИ, а компания OpenAI выпустила эксклюзивную версию модели o1 для подписчиков ChatGPT за $200, способную рассуждать.

Google показала ИИ-агента, который помогает проходить игры, наблюдая за действиями игрока

Google представила новую версию платформы искусственного интеллекта Gemini 2.0, с помощью которой можно создавать ИИ-агентов для советов и подсказок в видеоиграх. Агенты способны анализировать игровой процесс и предлагать оптимальные стратегии, а пользователи смогут получать рекомендации в режиме реального времени.

 Источник изображения: Supercell, theverge.com

Источник изображения: Supercell, theverge.com

Как сообщают в блоге компании генеральный директор Google DeepMind Демис Хассабис (Demis Hassabis) и технический директор Корай Кавукчуоглу (Koray Kavukcuoglu), агенты «делают выводы об игре, основываясь исключительно на действиях на экране, и предлагают решения в режиме реального времени». Кроме того, они могут использовать поиск Google по базам знаний для предоставления более полной информации. Агенты уже тестируются в популярных играх, таких как Clash of Clans и Hay Day от Supercell. Однако, как пишет The Verge, технология находится на ранней стадии разработки, и пока не ясно, насколько полезными такие наставники окажутся для игроков.

Помимо помощи в видеоиграх, Google развивает и другие направления применения Gemini 2.0. Например, ведётся работа над проектом Genie 2, который создаёт виртуальные игровые миры на основе лишь одного изображения. Пока эти миры остаются стабильными только около минуты, однако эксперты видят большой потенциал технологии.

Также компания представила мультимодальные возможности Gemini 2.0 Flash, которые уже доступны разработчикам через API в Google AI Studio и Vertex AI. Новая версия отличается высокой скоростью работы, улучшенной обработкой данных и способностью генерировать изображения и текст, а также преобразовывать текст в речь на нескольких языках. Эти функции уже тестируются ранними партнёрами, а в январе платформа станет доступна широкой аудитории.

Среди других проектов можно выделить Project Astra, Mariner и Jules. Project Astra, созданный для использования на Android-устройствах, был улучшен с помощью Gemini 2.0. Теперь ассистент на базе Astra может разговаривать на нескольких языках, использовать Google Search, Maps и Lens, а также запоминать больше данных, сохраняя при этом конфиденциальность. Project Mariner исследует, как ИИ может помогать в браузере, распознавая текст, изображения, код и другие элементы интерфейса, а Jules предназначен для помощи разработчикам в их рабочих процессах на GitHub.

ИИ-агенты также могут применяться в физическом мире. Исследования Google показывают, что Gemini 2.0 способен использовать пространственное мышление в робототехнике. Хотя эти разработки находятся на ранней стадии, сама компания видит большой потенциал в создании агентов, которые способны взаимодействовать с реальной средой.

Чтобы минимизировать риски и обеспечить безопасность своих ИИ-сервисов, компания проводит масштабные тестирования, сотрудничает с доверенными тестировщиками и внешними экспертами. В ближайшем будущем Google планирует интегрировать возможности Gemini 2.0 во все свои продукты, включая мобильное приложение Gemini.


window-new
Soft
Hard
Тренды 🔥
В Турции заблокировали Rutube, но сам видеосервис это отрицает 6 мин.
Представлен формат изображений Spectral JPEG XL, который эффективно сохранит данные даже о невидимом свете 41 мин.
Google выплатит $100 млн по иску рекламодателей 14-летней давности 6 ч.
ИИ-стартап xAI Илона Маска внезапно поглотил соцсеть X Илона Маска 9 ч.
Новая статья: Selaco — неоновый кураж. Предварительный обзор 14 ч.
«Яндекс» впервые отчиталась о результатах работы Yandex B2B Tech 14 ч.
Prince of Persia: The Lost Crown выйдет на новых платформах, причём совсем скоро 16 ч.
Сюжетный боевик MindsEye от студии экс-продюсера GTA получил дату выхода и взрывной трейлер — в российском Steam доступен предзаказ 17 ч.
38 миллиардов потерянных рун и 58 тысяч побед над финальным боссом: опубликована статистика игроков с тестирования Elden Ring Nightreign 19 ч.
Тестовая версия Windows 11 получила расширенную поддержку файловой системы ReFS — она сменит NTFS, но потом 20 ч.